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Sobre este temario 


AlbaPedroZapater [arroba] gmail [punto] com 


Este temario se ha preparado a partir de distintas fuentes con el objetivo de servir como una base útil 
para cualquier persona interesada en el estudio y preparación de oposiciones de matemáticas de secundaria. 
Aunque los temas aquí expuestos no son extremadamente sofisticados, pueden ser un buen punto de partida 
para desarrollar temas propios y profundizar en los conocimientos necesarios. Me gustaría dar crédito y 
agradecer a los temas que se pueden encontrar públicamente, especialmente los de Jose Luis Lorente. 


El contenido de este temario está licenciado bajo Creative Commons Attribution-NonCommercial- 
ShareAlike (CC BY-NC-SA). Esto significa que puedes compartir y adaptar el material, siempre y cuando 
atribuyas la autoría original, no lo utilices con fines comerciales (esto incluye academias y preparadores de 
oposiciones), y distribuyas tus contribuciones bajo la misma licencia. Esta licencia promueve la colaboración 
y el enriquecimiento del conocimiento colectivo, lo cual es particularmente importante en el contexto de las 
oposiciones. Este proceso, que a veces puede generar una competitividad poco saludable, puede beneficiarse 
de un enfoque más colaborativo y de apoyo mutuo. 


Si te interesan los archivos fuente, escritos en LaTeX, no dudes en ponerte en contacto conmigo. Estaré 
encantada de compartirlos para que puedas modificarlos y adaptarlos. 


Finalmente, quiero aclarar que no me hago responsable de los posibles errores o erratas que puedan 
aparecer en los temas. Aunque se ha puesto el mayor cuidado en la preparación de este material, es posible 
que existan imprecisiones. 


Transmitirte mucho ánimo en la preparación de las oposiciones y recordarte que es una carrera de fondo, 
que para llegar a la meta es imprescindible dosificar fuerzas y cuidar la salud mental. 
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1 Introducción: Génesis y fundamentación de la noción de número 


La noción primitiva de número se remonta a los inicios de la humanidad y su desarrollo fue un proceso largo y lento. Muchas 
civilizaciones antiguas solo distinguían entre uno y muchos, o entre uno, dos y más de dos. Incluso algunas tribus actuales solo 
conocen dos nombres de número: uno para la unidad y otro para el par. Todo parece indicar que apareció de manera gradual 
una consciencia de una propiedad abstracta que tienen en común ciertos grupos, a lo que llamamos número. Probablemente 
la clave en ese paso está en la constatación empírica que hace el hombre a través de experiencias desordenadas, de que ciertos 
grupos de cosas pueden ponerse en correspondencia biunívoca. La consciencia de número dio paso a la necesidad de expresar 
esta propiedad mediante un lenguaje simbólico. 

Al principio se usaban los sistemas quinario (base 5) y decimal debido a que se contaba con los dedos de una o las dos manos. 
Después se paso al uso de montones de guijarros para representar correspondencias biunívocas y luego a hacer muescas en 
un palo o trozo de hueso con la ayuda de un sílex. Lo más probable es que los signos para representar números precedieran a 
las palabras porque era más fácil hacer muescas que establecer una frase. Los miles de años que la humanidad necesitó para 
la abstracción de número se explica por la tendencia del lenguaje a desarrollarse de lo concreto a lo abstracto. La noción de 
número reviste dos aspectos complementarios: uno llamado cardinal que solo se basa en el principio del emparejamiento y el 
otro, ordinal, que exige el concepto de sucesión. En realidad todo elemento de la serie regular de los números naturales se 
obtiene añadiendo una unidad al anterior. La base de los progresos en la consolidación del concepto de número es la facilidad 
de identifica lo aspectos cardinal y ordinal. 

Mientras que en la práctica el número cardinal es el que nos interesa, éste es incapaz es incapaz de servir de base a una 
aritmética, pues las operaciones están fundadas en la hipótesis de que siempre podemos pasar de un número cualquiera a 
su sucesor. Ahora bien, en esto consiste la esencia del concepto de número ordinal. Sin nuestra facilidad para disponer los 
objetos según la sucesión natural se habría progresado muy poco. Nuestro sistema numérico esta impregnado de estos dos 
principios, el de la correspondencia y el de la sucesión, que constituyen el tejido de todas las matemáticas. 

A finales del siglo XTX /principios del XX se plantea la construcción formal de los número naturales por dos vías diferentes. 
Como concepto primitivo, el número natural puede introducirse axiomáticamente, camino seguido por Peano y Hilbert. Como 
alternativa, como concepto derivado de la teoría de clases, se basa en la idea de conjuntos coordinables, camino iniciado por 
Cantor y Frege y perfeccionado por Russell. 

La definición de cardinal, tal como se conoce hoy, se debe al lógico y matemático alemán Frege. Intento dar una noción de 
cardinal más rigurosa, apoyándose en la idea de correspondencia biunívoca entre dos conjuntos. Pero la teoría de conjuntos 
trajo el hallazgo de "conjuntos paradójicos” que condujo a cuestionar la existencia del "conjunto de todos los conjuntos”. 
Partiendo de un objetivo similar al de Frege, Giussppe Peano intentó desarrollar un lenguaje formalizado que permitiera 
fundamentar la aritmética. Su nombre ha quedado asociado a los axiomas de Peano, sobre los que se han apoyado tantas 
construcciones rigurosas del álgebra y del análisis. Eligió tres conceptos primitivos: cero, número, y la relación binaria ”es 
sucesor de” y estableció sus cinco postulados. 

No obstante fue Hilbert el verdadero sistemizador del pensamiento axiomático. Aunque el método axiomático fue univer- 
salmente aceptado se abría una crisis de los fundamentos que conmovería el mundo matemático entre 1900 y 1930. 

Hay que señalar que el desarrollo completo de ambos procedimientos, el axiomático de Peano y el conjuntista de Russell, 
no fueron en su día totalmente satisfactorios. Por un lado el sistema de Peano es axiomático y ordinal en su iniciación y 
posteriormente intenta desarrollar la teoría cardinal. Mientras por otro lado Russell desarrolla la aritmética cardinal como 
un capítulo de la teoría de clases y posteriormente introduce el número ordinal. En ambos la justificación lógica del aspecto 
postergado aparece a la intuición como inútilmente complicada, al demostrar teoremas cuya sola enunciación ”evidente” 
asombra al principiante. 


2 Construcción axiomática de los naturales 


2.1 El sistema axiomático de Peano 
El conjunto de los números naturales se define como un conjunto N que verifica los axiomas siguientes: 


e Axioma 1: Cero es un número natural (0 € N). 
(Nota: En la formulación original Peano estableció el uno y no el cero como primer número natural. Este axioma 
implica que N es no vacío ya que contiene al cero ) 


e Axioma 2: A cada número natural n € N, le corresponde otro número natural al que llamamos sucesor o siguiente de 
n y al que denotaremos por n*,sg(n) ó d(n). SineN =>n* EN. 
(Nota: Este axioma da el procedimiento general de la construcción de los números naturales, N = (0, 1,2, 3, 4...), siendo 
(0) = 1,0(1) = 2,0(2) = 3,etc;) 


e Axioma 3: Cero no es el siguiente de ningún número natural. 
(Nota: Este axioma impide que se vuelva al 0) 
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e Axioma 4: A dos números naturales distintos corresponden siguientes distintos, o lo que es lo mismo, los siguientes de 
dos números son iguales si y solo si ambos números son iguales. Sin,mEeN:n* =m* Sn=m. 
(Nota: Este axioma garantiza que la cadena de ”siguientes” es infinita. Diremos que el conjunto de los números 
naturales están engendrados a partir del cero obteniendo el siguiente de cero (uno), el siguiente del siguiente de cero 
(dos), etc) 


e Axioma 5: Si un conjunto de números naturales U contiene al cero y también al sucesor de cualquier número que 
pertenezca a U, entonces todo número pertenece a U. Si U CN cumple (0€EUANEU=>n*EU)=>U=N 
(Nota: Este axioma concebir los naturales en su forma final, se conoce como axioma de recurrencia) 


2.2 Principio de inducción matemática 


Sea P una propiedad que se refiera a un número natural n cualquiera. Designaremos por Pp, P,,Pa,... la sucesión de 
proposiciones que se refieren a n =0,n= 1,n =2,... El principio de inducción matemática dice: 
Supuesto que: 


1. La proposición Py es cierta 
2. Bajo la hipótesis de validez de P,, puede deducirse la validez de P,, +1 


Entonces son ciertas todas las proposiciones de la sucesión P,, y la validez de la propiedad general P quedaría así probada. 
Consecuencias: 


e Teorema 1: Todo elemento de N es diferente de su siguiente. (n* 4 n,Vn € N) 


e Teorema 2: Todo elemento de N, salvo el cero, es el siguiente de algún número natural. (Nótese N* = NA (0) entonces 
Vn € N* : 3m € Nim* =nm) 


e Corolario: La correspondencia de d de N en N* definida por o(n) = n* es biunívoca. 
La recíproca 07! de N* en N nos da la definición de precedente. 


2.3 Suma de números naturales 


Definición: A todo par (x, y) de número naturales asociamos otro número natural, llamado suma de x e y que denotamos por 
x +y, definiéndolo por recurrencia como sigue: 


l. 2+0=x 
2. Suponiendo definido x + y, definimos » + y? como 2 +y* = (12 +y)* 


La notación de siguiente de n aplicando la suma sería o(n) =1+m: 


e (0) = 1, aplicando x +0 = x, tenemos que (0) =1+0 

e 0(1) =2, aplicando lo anterior y x + y? = (2 + y)*, tenemos que 0(1) =0(1+0)=1+0(0) =1+1 
e Por inducción, oc(n+1) =0(n+1+0) =n+1+0(0) = (n+1)+1 

Propiedades: 


1. La suma está bien definida: Vn,m € N:n+m € N. Equivale a decir que es estable o cerrado para la operación y puede 
probarse por inducción respecto a m. Asimismo, la unicidad está garantizada por la axiomática. la ley de composición 
+:N-N :>ÑN es una operación interna en el conjunto ÑN. 


2. Asociatividad: Para cualesquiera m,n,p € Nes (m+mnm) +p=m+ (n+p). Fijando m y n se prueba por inducción 
respecto a p. Podemos decir que (N, +) es un semigrupo aditivo. 


3. Elemento neutro: Existe un elemento de N, que es el cero, verificando: n+0=0+m= n,Vn € N. Por la propia 
definición de suma el cero es neutro por la derecha y se demuestra por inducción que también lo es por la izquierda. 


4. Conmutatividad: Para cualesquiera m,n € N se cumple m+mnm =mn-+m. Fijando m se prueba por inducción respecto 
an 


5. Ningún número natural salvo el cero tiene simétrico!, m+n=0=>m=n=0. 
Razonamos por reducción al absurdo. Suponemos m+mn = 0 con n X 0 entonces existiría un n' precedente de n tal 
queen +1=n>m>+n=0=>m>+n+1=0= (m>+n')* =0 lo cual contradice el axioma 3. 


6. Ley cancelativa o simplificativa: m+p=n+p=>m= mn. Ello significa que todo número natural es regular para la 
suma, también se prueba por inducción. 


lelemento que combinado con otro obtienes el elemento neutro o identidad de esa operación. Por ejemplo, en la suma de enteros, el elemento 
simétrico de un número es su opuesto (el negativo). 
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2.4 


Producto de números naturales 


Definición: A todo par (x,y) de números naturales asociamos otro número natural llamado producto de x e y, que denotamos 
por (x - y), definiéndolo de forma recurrente como sigue: 


e x-0=0 (El cero es elemento absorbente por la derecha) 


e Suponiendo definido zx - y, definimos x - y? como 2-y*=x-Yy+z2x 


Propiedades: 


1. 
2. 


2.5 


El producto está bien definido: Vn,mEN:n-mEN 


Distributiva respecto a la suma: Para cualesquiera m, n, p € N se cumplen m-(n+p) = m"n+m-p y (m+n)-p = m-p+n-p. 
Fijando m y n se demuestra por inducción respecto a p. 


Asociatividad: ”Para cualesquiera m,n,p € N se cumple (m-n)-p = mm: (n- p). Fijando m y n se demuestra por 
inducción respecto a p. 


Conmutatividad: Para cualesquiera m,n € N se cumple m-n = nm. Para probar esta propiedad tenemos que 
apoyarnos en otras dos previas que se pueden demostrar por inducción: 


e Todo número natural conmuta con 1 (VneN:n-1=1-n) 


e El cero es absorbente por la izquierda para el producto (Vn € N :0-n =0). 
Se prueba ahora por inducción respecto a m. 


Elemento neutro: Existe un elemento de N, que es el uno, verificando n-1=1+.n = n,Vn € N. Las propiedades 
distributivas y conmutativa nos lleva a que uno es neutro por la derecha y por la izquierda. Podría justificarse también 
por inducción respecto a n. 

Podemos decir que la estructura multiplicativa (N, -) es también semigrupo abeliano con elemento neutro (unidad). Por 
tanto (N, +, +) es un semianillo abeliano. 


En los números naturales no hay "divisores de cero”: mn =0=>m=0Vmn= 0. Se prueba por reducción al absurdo. 


Ley cancelativa o simplificativa: Si n-m =mn-+-p => m= p,Vn € N*. Todo número natural, salvo el cero, es regular para 
la multiplicación. Se demuestra por inducción. 


Ningún número natural, salvo el uno, tiene simétrico: m-n =1=>m=m= l. Se demuestra por reducción al absurdo. 


Orden en los naturales 


Definición: Dados dos números naturales a y b decimos que a es menor o igual que b y escribimos a < b, si existe un número 
natural x tal que a+x=b. a<b< 3x € Nla + a =b. Decimos también que b es mayor o igual que a y puede escribirse 


b> a. 


Propiedades: 


Í, 


Unicidad: x de a+ x = b siendo a < b es único. 
Demostración: Si existen dos números naturales x, x” que cumplen a+ x= =b y a+x'=b entonces a+ 1 =a-+x2! y al 
ser todo número a regular x= x”. 


Reflexiva: Va € N : a < a. Su demostración es trivial ya que el cero cumple para cualquier a € N quea+0=a 


Antisimétrica: a <bAb<a=a=b. 

Para demostrarlos sabemos que si a < b => 3x1 € Nla+x =bysib<a => Jy € Nib+ y = a. Sustituimos el valor 
de b dado por la primera en la segunda: (a+) +y=a. Aplicando la propiedad asociativa y cancelativa de la suma 
obtenemos que + y = 0 y como ningún número natural tiene simétrico salvo el cero, esto implica que x = y = 0 y por 
lo tanto a = b. 


Transitiva: a <bAb<c=>ac<c. 

Para demostrarlo sabemos que si a <b= Jx € Nla+ x =b y sib<c=> Jy € NIb+y=c. Sustituyendo en la segunda 
igualdad el valor de b dado por la primera (a+ x) + y =c. En virtud de la asociativa a+ (x+y) =c=> a < c. Con las 
propiedades anteriores determinamos que < es una relación de orden. 


Conexa: Va, bEN:a<bvb< a. 
Con esta última propiedad determinamos que < es una relación binaria de orden total y por lo tanto (N,<) es un 
conjunto totalmente ordenado. 
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2.5.1 Compatibilidad del orden con las operaciones 


e Ley de monotonía para la suma: Va,b,ceN:a<boa+c<b+ce 
Corolario: a <bAec<d=>a+c<b+d 


e Ley de monotonía para el producto: Va,b,ceN:a<boSa-c<b-c. 


Por lo tanto < es compatible con las operaciones en N y (N, +,-, <) es un semianillos abeliano totalmente ordenado. 


2.5.2 Relación de orden estricto 


Definición: Si existe un número natural x distinto de cero tal que a + x = b decimos que a es estrictamente menor que b y 
escribimos a < b, o bien que b es estrictamente mayor que a, b > a. 
Propiedades: 


1. Antirreflexiva: Va¿EN:a fa 
2. Transitiva: a <bAb<c>a<c 
3.a<b>azxb 


4. Ley de tricotomía: Va,bENsiafb:a<bvVvb<a 


2.5.3 Elementos consecutivos 


Sean dos números naturales a y b, suponemos a < b. Podemos decir que a es anterior a b o que b es posterior a a. Si además 
no existe ningún número natural posterior a a y a la vez anterior a b, entonces a y b son consecutivos. a y b consecutivos => 
a<bnÁx e Na < x < b. Estos conceptos son concordantes con siguiente y precedente 


2.6 Secciones de N y conjuntos finitos. El principio de buena ordenación. 


Se define una sección de N como el intervalo [1,n] = fx € N|l < x < nj. Diremos que el conjunto A es finito si y solo si 
existe una biyección entre A y una sección de N. 

El orden de N induce asimismo un orden total en cualquier conjunto finito A. Entonces los elementos del conjunto finito A 
pueden designarse a, a9, 43, .... Diremos que se trata de una sucesión finita. 

En general, los conceptos de primer y último elemento pueden definirse para cualquier conjunto ordenado A. Si en A hay 
un elemento que sea anterior a todos los demás se denomina primer elemento o mínimo de 4. Asimismo un elemento que sea 
posterior a los restantes se llama último elemento o máximo de A. Si existen son únicos. El conjunto A se dice bien ordenado 
si cumple que todo subconjunto del mismo tiene primer elemento. Recogemos algunas propiedades de N relacionadas con los 
conceptos anteriores: 


1. El conjunto N tiene un primer elemento, que es el cero, pero no tiene último elemento. 


2. Todo subconjunto no vacío de N tiene primer elemento o, lo que es lo mismo, (N,<) es un conjunto bien ordenado. 
Principio de buena ordenación. 


3. Toda parte finita de N admite un primer elemento y un último elemento. 

4. Si una parte no vacía de N tiene último elemento, se trata de un conjunto finito. 

5. Para que una parte no vacía de N tenga último elemento es necesario y suficiente que sea finita. 
6. Toda parte infinita de N no admite último elemento. 


7. Toda parte infinita de N admite un primer elemento. 


3 Construcción de N basada en la teoría de clases 


3.1 Construcción conjuntista recurrente 


Hay procedimientos estándar para construir N que se basan en identificar cada número con un conjunto-modelo, de manera 
que cada uno se va definiendo a partir del anterior. El axioma de recurrencia nos dice que todos los cardinales finitos pueden 
formarse así. El axioma garantiza que mediante este proceso obtenemos un conjunto infinito. 

0=/ 

0+ =0Uf0) = (0) = 1 
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1+=1U(1)=(0,1)=2 

2+ =2U[2+=(0,1,2)=3 

etc; 

La idea clave de esta construcción es que si definimos el sucesor de un conjunto A como el conjunto A+ = AU(A), entonces 
se cumple una propiedad crucial: ACXCAFT=>X=AVX= A?, En efecto, si fuese X 4 A, existirá algun elemento zx 
tal que € X Az É A, pero como X C A* debe ser x € A? = AULA). Puesto que x € A, será x € LA), y por tanto = A. 


A Sistemas de numeración 


4.1 Introducción histórica 


Hace 5000 años los egipcios empezaron usando un sistema de numeración jeroglífico basado en una escala numérica de base 10 
y un sencillo esquema iterativo. Posteriormente el tedioso principio repetitivo de la numeración jeroglífica se ve reemplazado 
por la introducción de cifras o símbolos especiales para representar los dígitos y los múltiplos de las potencias de 10. 

Los babilonios tenían un sistema de numeración ya completamente desarrollado en el cual el sistema decimal quedaba 
sumergido bajo un sistema en el que la base fundamental era 60. 

Los mayas usaban un sistema de numeración en base 20 con sub base 5, posicional y con uso del cero. Esto puede haber sido 
la aparición más temprana conocida del concepto del cero explícito en el mundo (disputado con los babilonios). 

Parece haber existido dos sistemas de numeración principales en Grecia, ambos basados en una escala de base diez. El más 
primitivo, ”ático”, consiste en un simple esquema iterativo, en cambio, el cifrado del posterior sistema ”alfabético” parece 
intuir el principio posicional, pero no terminaron de ver del todo las ventajas de este paso. 

Los romanos utilizaron los grafismos conocidos como cifras romanas, pero este sistema no servía para hacer cálculos, por lo 
que siempre recurrían al ábaco. 

El sistema de numeración de los chinos permaneció esencialmente decimal y aportación principal fue la introducción de 
una nueva regla, el principio multiplicativo, que ampliaba considerablemente las posibilidades de representación de números 
grandes y acababa con las limitaciones del viejo principio de la suma de griegos y egipcios. 

La ideal del valor local o posicional estaba presente en el sistema de numeración babilónico, pero los hindúes se dieron cuenta 
que era también aplicable al sistema de notación decimal. Aunque las formas hindúes medievales de las diez cifras son muy 
diferentes a las que usamos hoy en día, podemos decir que fue en el norte de la India, alrededor del S.V donde nació el 
antecesor de nuestro sistema de numeración moderno que quedó establecido definitivamente en una nueva combinación de 
tres principios básicos, todos ellos de un origen mucho más antiguo: 


1. Una base decimal 
2. Una notación posicional 
3. Una forma cifrada para cada uno de los diez numerales básicos 


La creencia de que nuestro sistema de numeración procede de los árabes es falsa. Sería más correcto llamar a nuestro sistema 
de numeración sistema hindú-árabe ya que los árabes lo que hicieron fue adoptar los principios del sistema de numeración 
hindú y garantizar su continuidad transmitiendolo a Europa. 


4.2 Nociones generales 


Al ser infinita la serie de números naturales, obviamente, no podemos utilizar un símbolo particular para cada uno de ellos. 
Entonces es preciso un conjunto finito de signos (palabra, iconos, etc;) que, combinados mediante unas cuantas reglas o 
convenios, permitan simbolizar cualquier número natural. 

Denominamos ”sistema de numeración” al conjunto de normas y convenios que se utilizan para representar todos los número 
naturales, mediante la adecuada combinación de un grupo reducido de signos. Cada número cardinal tendrá ”representa- 
ciones” distintas según el sistema de numeración utilizado. Los signos o símbolos básicos se llaman cifras o dígitos del 
sistema. Nos referiremos a sistemas de numeración posicional basados en el principio de valor relativo, como nuestro sistema 
de numeración decimal. Esencialmente se establece un número ”b” como base del sistema de numeración y los b primeros 
números naturales (empezando por el 0). de manera que desde el O hasta el b— 1 son unidades simples o de primer orden, 
se simbolizan con sus correspondientes cifras. Al llegar a b unidades se introduce la unidad de segundo orden, así b unidades 
simples constituyen una de segundo orden; después b unidades de segundo orden, una unidad de tercer orden y así sucesiva- 
mente... Cada b unidades de un orden constituyen una unidades del orden inmediato superior. 

De este modo en el sistema de numeración de base b usamos b cifras que simbolizan los números del 0 al b— 1. El principio 
del valor relativo permite usar la misma cifra para expresar ese número de unidades de otro orden, dependiendo del lugar 
que ocupe dicha cifra en la escritura. 

El sistema decimal (base 10) es indudablemente el de uso más extendido. Algunos sistemas como el quinario (base 5) o el 
sexagesimal (base 60) han quedado relegados al simple interés histórico. El mundo de la informática ha otorgado una rele- 
vancia especial al sistema binario (base 2), que sólo usa los dígitos O y 1 y es usado por los computadores para la codificación 
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interna de la información a través de los bits (un bit solo puede tomar valor 0 o 1). También es muy usado en informática el 
sistema hexadecimal ya que dos dígitos hexadecimales codifican un byte, que son 8 bits. Para codificar los dígitos del 10 al 
15 se usan las letras de la A-F, más adelante presentaremos un ejemplo. 


4.3 Teorema fundamental de la numeración 


Dada una base b (b € N y b > 1) entonces todo número natural n € N puede expresarse de manera única como: n = 
o00+0a1:b+a9:b?+a3-b8+... + az -d* siendo aj ENyaj<b(j=0,1,...,k). Esta expresión recibe el nombre de expresión 
polinómica del número n en la base b. 


4.4 El principio del valor relativo 


Podemos concluir que cada uno de los a, es una de las cifras elegidas en el sistema de numeración, es decir, todos los a; se 
escriben con una sola cifra. De ese modo el número natural n se puede expresar escribiendo ordenadamente sus cifras como 
n= A40-1...4904100(b, siendo b la base. Cuando se deduce la base del contexto no es necesario especificarla. 
Entonces se adopta el siguiente convenio: si se escriben sucesivamente, de modo ordenado, las cifras de un número, el orden 
de las unidades que cada una representa viene dado por el orden que ocupa en la escritura del número (principio del valor 
relativo). Así pues en la expresión n = 040-1...0490100(b la cifra a; representa las unidades de orden ¿+ 1. 


4.5 Propiedades de la numeración 


e Proposición 1: Si el número n se escribe n = a 0%—1...09010 en la base b entonces el número n-b” se escribe añadiendo 
h ceros a la derecha. Ejemplo: b=10, n=385, h=3, 385 - 10% = 385000 


e Proposición 2: Si el número natural m escrito en la base b tiene p cifras entonces dicho número esta comprendido entre 
bP=1 y bP. El reciproco también es cierto. 


my» tiene p cifras <= Poi<m<bp 
Ejemplo: m=385, 3 cifras, 10? < 285 < 10% 


e Proposición 3: Dados dos números m y n, que tienen respectivamente p y k cifras al expresarlos en base b si p< k => 
m<mn. 


e Proposición 4: Si m y n tienen el mismo número de cifras expresados en la base b, m < n si la cifra de mayor orden 
de m (primera empezando por la izquierda) es distinta de su correspondiente en n y menor que ésta. Si son iguales se 
comparará la siguiente de mayor orden, y así sucesivamente hasta encontrar dos distintas. 


4.6 Cambio de sistema 


e Paso de una base cualquiera a base decimal: Basta efectuar las operaciones indicadas en la expresión polinómica. En 
la práctica puede hacerse uso del teorema del resto para polinomios y utilizar el algoritmo de Ruffini. 


42135 =4-55+2-5%4+1-54+3= 558 


O bien: 
4 2 1 3 
5 20 110 555 
4 22 111 558 
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e Paso de una base decimal a una base cualquiera: Puede llevarse a cabo un procedimiento de división sucesiva, cuando 
llegamos a un cociente menor que la base, el proceso acaba. Entonces tomamos para la expresión del número en dicha 
base como primera cifra de la izquierda el último cociente y a continuación la sucesión de los restos en orden inverso. 
Por ejemplo: 

558 |5_ 
008 111 |5_ 
3 011 22 |5. 
Le 


558 = 42135 


e Cambio de una base a otra cualquiera: Si queremos pasar un número escrito en la base b a otra base Y , basta combinar 
los procedimientos anteriores, pasamos primero de base b a decimal y de decimal a base b'. No obstante hay algunos 
cambios de base particulares en los que el esquema anterior puede ser sustituido por un algoritmo más sencillo. Como 
decíamos en el apartado anterior en informática se usan tanto la base binaria (base 2) como hexadecimal (base 16), 
siendo la conversión de uno a otro muy fácil de llevar acabo. Los dígitos en el sistema hexadecimal van de emplean 
los dígitos A, B,C, D, E, F para representar los valores 10,11, 12,13, 14, 15, respectivamente. Así para pasar de binario 
a hexadecimal se agrupan los dígitos de cuatro en cuatro (comenzando por la derecha) codificándolos con su valor en 
hexadecimal. Por ejemplo,tomamos n = 10110111110101¿2, si agrupamos de cuatro en cuatro, 10 = 2,1101 = D, 1111 = 
F,0101 = 5, es decir, n = 2DF5(16. El paso de hexadecimal a binario es igual de sencillo, codificando cada uno de sus 
dígitos con su valor en binario. 


4.7 Algoritmos de las operaciones básicas 


La ejecución de las operaciones elementales (+,—,-,:) con números expresados en base no decimal se pueden automatizar 
mediante algoritmos muy similares mediante algoritmos muy similares a los usados en el sistema decimal. De todos modos, 
siempre pueden convertirse a base decimal, operar con ellos y volver a convertirse a la base original. 


5 Aspectos didácticos 


Es en la orden ECD/1172/2022, del 2 de agosto de 2022, en la que se aprueba el currículo y las características de la evaluación 
de la ESO. Dentro de los saberes básicos es el sentido numérico donde especialmente se desarrolla este tema. Este sentido se 
trabajará al desarrollar las competencias específicas a lo largo de toda la etapa pero será especialmente en primero y segundo 
de la eso donde se aplicarán las propiedades y operaciones con los números naturales y los sistemas de numeración. 
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1 Introducción 


Al matemático suizo Leonard Euler se le considera el padre de la teoría de grados por el planteamiento y solución del problema 
de los «puentes de Kónigsterg> (S.XVIII) usando por primera vez conceptos y métodos de la teoría de grafos. 

Los primeros problemas de la teoría de grafos surgieron de la búsqueda de soluciones de algunos problemas cotidianos y 
también en el planteamiento de algunos acertijos matemáticos como el citado, el problema del transporte, el problema del 
agente viajero, etc... 

El problema de los puentes de Kónigsterg consistía en que en que en dicha ciudad había dos islas y siete puentes, y la 
pregunta que los habitantes escribieron al famoso matemático, Euler, fue si comenzando y terminando en cualquier parte, 
una persona podía atravesar la ciudad cruzando los siete puentes sin repetir ninguno dos veces. Euler demostró que ese paseo 
era imposible y reemplazó las islas y los dos lados del río por puntos y los puentes por curvas. El paseo sólo es posible si y 
solo sí el grafo tiene un ciruito eureliano y no es el caso como demostraremos. 


2 Definición de grafo 


Se denomina grafo G al par (V(G), E(G)), V(G) conjunto finito (distinto del conjunto vacío) de elementos denominados 
vértices y E(G) conjunto finito de pares no ordenados de elementos de V(G) denominados aristas. Se dice que dos vértices 
de u y w de un grafo G son adyacentes si el grafo contiene una arista que los une. Dos aristas son adyacentes si tienen al 
menos un vértice en común. Se denomina grado del vértice v de G al número de aristas que inciden en él y se denota g(v). 
Un lazo en vu (arista que comienza y termina en v) contribuye de manera doble al grado de v. Será vértice asilado si es de 
grado O y terminal o extemos si es de grado 1. Un subgrafo de un grafo G, es un grafo cuyos vértices pertenecen a V(G) y 
cuyas aristas pertenecen a E(G). 


3 Tipología de grafos 


e Grafo general: o grafo es el definido anteriormente 


e Grafo simple: G = (V(G), E(G)) tal que Vu, v con u 4 v € V(G), existe a lo sumo una arista (u,v) € E(G) que los 
une. 


yr 
170 v x 


e Grafo orientado: También red, D, se define como un par (V(D), A(D)), V(D) conjunto finito (distinto del conjunto 
vacío) de elementos denominados vértices y A(G) conjunto finito de pares ordenados de elementos de V(D) denominados 
arcos o aristas orientadas. 


e Grafo nulo: E(G) = (), todo vértice es aislado; el de n vértices se denomina N,, 


e Grafo completo: Es un grafo simple en el que cualquier par de vértices son adyacentes. Un grafo completo de n vértices 


tiene min) aristas y se designa K, 
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e Grafo regular: Todos los vértices tienen el mismo grado, grafo regular de grado r. El grafo nulo es un grafo regular de 
grado 0. Todo grafo completo con n vértices es un grafo regular de grado n— 1. 


e Grafo bipartito Un grafo G = (NW, E) es bipartito si N se puede particionar en dos conjuntos U y V, es decir, tal que 
UUV=NyUNV =/, de manera que las aristas sólo pueden conectar vértices de un conjunto con vértices del otro; 
Será completo si todos los vértices de uno de los subconjuntos están relacionados con los del otro subconjunto. 


4 Operaciones entre grafos 


4.1 Isomorfismo y Homeomorfismo 


G1 y G2 son isomorfos si existen correspondencia biunívoca entre los vértices de G, y G2 con la propiedad de que el número 
de aristas que une cada dos vértices de G, es igual a las que unen los correspondientes de Ga. 


Dos grafos son homeomorfos (o idénticos salvo vértices de grado 2) si ambos pueden ser obtenido del mismo grafo 
insertando nuevos vértices de grado 2 en sus aristas. 


4.2 Combinaciones de grafos 

Sean G1 y G2 con V(G1) y V(G2) disjuntos, se define el grafo unión como G1 UG» = (V(G1)UV(G2), E(G1)U E(G2)). Un 
grafo es conexo si no puede ser expresado como la unión de dos grafos, en caso contrario es inconexo. 

4.3 Suma 


G¡ + Ga, unión de ambos grafos, tranzándose una arista entre cada vértice de GF, y cada vértice de Ga. 


4.4 Supresión y contracción 


Sea F un conjunto de aristas del grafo G, G— F es el grafo que se obtiene cuando se suprime en G el conjunto de aristas FF. 
Sea H conjunto de vértices, G — H es el grafo que se obtiene cuando se suprimen los vértices de H y las aristas que 
inciden en ellos. 
Sea G grafo y en él la arista e = (x, y), G/e es el grafo contracción obtenido al eliminar la arista, identificando x con y 


Tema 2 


4.5 Grafo complemento 


Sea G grafo simple, el complemento de G, G es el grafo simple que tiene a V(G) como conjunto de vértices, en el cual son 
adyacentes si y solo si no son adyacentes en G. 


5  Trayectorias 


Se entiende por camino una secuencia de aristas dadas en un cierto orden. Si consideramos caminos de la forma u > > 


x —> y se denominan circuitos o ciclos. Un grafo conexo es aquel en el que cada par de vértices está conectado al menos por 
un camino. 


6 Matrices asociadas a un grafo 


Dado un grafo simple G = (V, E) con V = ([1,..,nj llamaremos matriz de adyacencia a la matriz n x n, M definida por 


lsi (1,7) € E 
Mij= 
2 l0si(ij)g2 E 
Indica si dos vértices son adyacentes. La matiz será simétrica para grafos no dirigidos. Si el grafo no es simple si (1,j) € E 
entonces mj¿ será igual al número de aristas que unen los vértices v; y U;. 


M* da el número de caminos con k aristas que unen a cada par de vértices (se demuestra por inducción). La consecuencia 
es que un grafo es conexo si la matriz C = M + M?+... + M"L no tiene elementos nulos. 


Dado un grafo simple G = (V, E) con V =(1,..,nj y E =(ej,..,€m), llamaremos matriz de incidencia a la matriz n x m, 


M definida por 
1 si; € ej 
Mij = : 
0 si Vi Z e; 
Como cada arista incide exactamente en dos vértices, cada columna tiene exactamente dos unos. El número de unos que 


aparece en cada fila es igual al grado del vértice correspondiente. Una fila compuesta sólo por ceros corresponde a un vértice 


aislado. En el caso de un grafo simple dirigido se marcará con 1 y —1 la orientación de la arista, vértice inicial y vértice final 
de la arista respectivamente. 


ab v flaho- Aduaania Camines des aus, 


Y, Vi Y 
Va ÉS V, Y2z Y3 cl A d 
NO 4d 0 2 
e Czs3 1f=,0 AE 
o e not 
a AE) E E 
Camto 2 ans dara ¡naa 
Y Va Vs eV les 
NO 27O Y AITO 
MIEDO eo A de quee 
1nOoZzo O 


7 Grafos eulerianos 


Volvemos al problema de los puentes de Kónigsberg que consiste en buscar una cola cerrada que recorra todas las aristas 
(puentes) del grafo (circuito euleriano). Euler probó que no era posible: si existe ese camino, el número de aristas que salen 
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de un vértice debe ser igual al que entran, por lo que los vértices deben tener grado par. Pero en el grafo del problema de los 
puentes todos los vértices son impares. Planteó el problema en general: ¿En qué grafos podemos encontrar una cola cerrada 
recorriendo todas sus aristas? En los grafos eulerianos. 

Teorema: Sea G = (V, 4) un grafo conexo. Entonces, G es euleriano si, y solo si, todos los vértices son de grado par. 
Demostración 


e => Supongamos que el grafo es euleriano y probemos que el grado de todo vértice es par. Sea Q un circuito euleriano 
que, en medida que contiene todas las aristas, pasa por todos los vértices; sea y un vértice cualquiera, que tiene que 
pertenecer a Q y que eventualmente puede estar repetido. Cada aparición del vértice en el circuito contribuye a dos 
unidades al grado del vértice (tenemos que contar la arista de llegada que se utiliza por primera vez ya que no se pueden 
repetir aristas, y la de salida que tampoco ha sido utilizada antes); la contribución es de dos unidades porque las aristas 
adyacentes que figuran en la secuencia no han estado utilizadas anteriormente. Si k es el número de apariciones del 
vértice, entonces el grado es g(v) = 2 + k, es decir, par. 


e = Supongamos que el grado de todo vértice es par y vamos a probar que el grafo es euleriano. Tenemos que encontrar 
un circuito euleriano en el grafo G. 


Seleccionamos un vértice arbitrario v y formamos un circuito Q que se inicia en v tal como se indica a continuación. 
Si empezamos por v, cada vez que se alcanza un vértice se selecciona una arista que sea incidente y que no haya 
sido utilizada anteriormente, continuamos con el otro vértice extremo. Puesto que el grado es par, en cada vértice 
disponemos de una arista de salida para cada arista de llegada; la única excepción a la regla es la del vértice inicial v, 
en dónde se ha utilizado una arista de salida sin haber utilizado ninguna de entrada, y por lo tanto, si se llega a un 
vértice que ya no tiene más aristas con las que continuar el recorrido (7, éste es el vértice inicial v. 


Cuando esto pasa hay dos posibilidades: (Q ya contiene todas las aristas, en este caso hemos construido un circuito en 
el grafo,en cuyo caso, ya hemos acabado y este es el circuito euleriano que queríamos construir. O no contiene todas 
las aristas, en este caso hemos construido un circuito en el grafo y entonces, por conexión, algún vértice del circuito es 
incidente con alguna otra arista no incluida en (Y; este vértice se puede utilizar de punto de partida para la construcción 
de un nuevo circuito Q” que no contiene aristas de Q y que vuelve al vértice de partida puesto que en G — Q cada 
vértice es todavía de grado par. La reunión QU Q” es un circuito; si contiene todas las aristas, hemos acabado. De lo 
contrario se repite el proceso hasta obtener un circuito euleriano (el proceso acaba debido a la finitud del grafo). 


En un grafo conexo existe una cola entre los vértices a y b que recorra todas las aristas si a y b son los únicos vértices de 
grado impar. Se demuestra de la misma manera si añadimos una arista nueva que una a y b 


8 Grafos hamiltonianos 


En 1859 el matemático irlandés W.R.Hamilton puso en circulación un rompecabezas basado en un dodecaedro regular, 
consistía en estudiar si se podía recorrer sus 20 vértices sin repetir ninguno moviéndose a través de las aristas. Desarrolló 
una versión mediante un grafo plano isomorfo. Puede comprobarse que en este grafo existen circuitos que pasan por todos 
sus vértices sin repetir salvo el inicial/final (trayectoria cerrada). 


De forma general: Un grafo es Hamiltoniano si existe una trayectoria cerrada que recorra todos sus vértices. 

Todo grafo hamiltoniano es conexo (no puede haber vértices aislados), pero no se ha conseguido una propiedad sencilla 
para caracterizarlos. Existen grafos eulerianos no hamiltonianos y viceversa pero coinciden si todos los vértices del grafo 
tienen grado 2. 


9 Planaridad y dualidad 


Un grafo es plano si puede trazarse en el plano tal que ningún par de aristas se corten geométricamente; excepto en el vértice 
en el que ambas coinciden. Un grafo es planar si es isomorfo a un grafo plano. Enunciamos una seria de teoremas sin 
demostraciones debido a su complejidad y extensión: 
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e K3 3 (el grafo bipartito completo de 6 vértices) y K5 (el grafo completo de 5 vértices) son no planares. 


e Teorema de Kuratowski: Un grafo es planar si no contiene ningún subgrafo homeomorfo a K5 o K3 3 


Un grafo es planar si y sólo si no es contraible a K5 y K3 3 


Fórmula de Eurler: Si G grafo plano conexo, n número de vértices, m número de aristas y f número de caras de G se 
cumple n—m+f=2 


c4 - externa Ea de 


[Euler para 
lie, planos 


Le E [(uare=a V-A+C=2 
En 
Sa | 5-7+4=2| 


Una región (o cara) de un grafo plano se define como una área del plano que está acotada por aristas y no pude continuar 
dividiéndose subáreas. 


Se define grafo dual Gx de G como el construido de la siguiente manera: 
e Se elige un punto v, en cada cara F, de G estos son los vértices de Gx. 


e Por cada arista e de G se traza una línea ex que atraviesa únicamente la arista e y se unen los vértices uv; a las caras 
adjuntas a e. Estas líneas son las aristas de Gx 


Teorema: Si G grafo plano de n vértices, m aristas y f caras y su dual Gx tiene nx vértices, mx aristas y fx* caras 
nx = f,mx*x=m, fx=n 


10 Diagramas en árbol 
Teoría de árboles debida a Cayley: Un grafo que no posee ningún circuito se denomina bosque, si además es conexo, árbol. 


A 


Bosque 


Sea T' un grafo con n vértices, son equivalentes: 
e T' es un árbol 
e T' no contiene ningún circuito y posee n— 1 aristas 


e T es conexo y cada arista es un istmo (su eliminación desconecta el grafo) 
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e Cada dos vértices de T' están conectados por una única trayectoria 
e T' no contiene ningún circuito, pero la adición de cualquier nueva arista crea exactamente uno 


Son muchos los problemas típicos de la teoría de árboles. En el área de Investigación Operativa, tenemos problemas 
famosos como el del camino más corto, el del conector mínimo... En química orgánica, la enumeración de moléculas químicas 
y el problema de redes en la teoría de redes eléctricas. 


11 Coloreado de grafos 


Un grafo sin lazos (es una arista que conecta al mismo vértice consigo mismo) es k — coloreable si puede asignarse a cada 
uno de sus vértices uno de k colores dados de forma que ningún par de vértices adyacentes tenga el mismo color. 

El origen de esta propiedad surge en 1852 de la conjetura del teorema de los 4 colores de Francis Guthrie. Esta dice que 
dado cualquier mapa geográfico con regiones continuas, este puede ser coloreado con cuatro colores diferentes o menos, de 
forma que no queden regiones adyacentes con el mismo color. Esta conjetura no pudeo ser probada hasta que en 1879 Alfred 
Bray Kempe anunció en la revista Nature que tenía una demostración para la conjetura. Desgraciadamente en 1890, Percy 
John Heawood encontró un error en la demostración de Kempe. Heawood no pudo demostrar que la conjetura no era válida, 
pero llegó a probar que con cinco colores se podía colorear cualquier mapa. 

Finalmente en 1976 la conjetura tuvo demostración, gracias a Kenneth Appel y Wolfgang Haken, que utilizaron un 
ordenador para la demostración, lo cual generó múltiples controversias en el ambiente matemático. Se considera el primer 
teorema demostrado con asistencia de un ordenador. Este problema engloba además otras situaciones similares como, por 
ejemplo, la distribución de las conferencias de un congreso de manera que dos conferencias que puedan ser de interés para 
una misma persona no se realicen al mismo tiempo. O por ejemplo el almacenamiento de productos químicos donde hay 
determinados productos que son incompatibles entre sí, y por tanto se deben almacenar de manera independiente. Todos 
estos problemas y muchos más se pueden resolver mediante la coloración de un grafo de la misma manera que se colorea un 
mapa. Y abre camino a otras cuestiones como cuál va a ser el mínimo número de colores necesarios para colorear un grafo o 
de cuantas formas posibles se puede colorear con un cierto número de colores k. 


12 Aplicaciones de la teoría de grafos 


En el ámbito de la logística y la planificación, la teoría de grafos se utiliza para optimizar la distribución de recursos, 
minimizar costos de transporte y encontrar la ruta más eficiente para la entrega de bienes. Los grafos dirigidos y ponderados 
son especialmente útiles en este contexto, ya que permiten modelar los flujos de productos y los costos asociados con precisión. 

En el campo de la computación y las redes, los grafos son esenciales para el diseño y análisis de algoritmos, así como 
para la optimización de la topología de redes de comunicación y sistemas informáticos distribuidos. Problemas como el 
enrutamiento de datos, la asignación de recursos y la detección de fallos se abordan mediante técnicas basadas en grafos. 

En biología y bioinformática, los grafos se utilizan para representar y analizar redes de interacción molecular, como las 
interacciones entre proteínas en una célula o los patrones de conectividad en redes metabólicas. Estos modelos ayudan a 
comprender mejor la estructura y función de los sistemas biológicos, así como a identificar posibles objetivos terapéuticos 
para enfermedades. 

En el ámbito social y psicológico, los grafos se aplican para estudiar redes sociales, influencia de opiniones, comportamiento 
de grupos y difusión de información. El análisis de redes sociales, por ejemplo, permite comprender la estructura y dinámica 
de las relaciones entre individuos, lo que tiene implicaciones en áreas como marketing, salud pública y política. 

En resumen, la teoría de grafos proporciona un marco poderoso y unificador para modelar y resolver una amplia gama 
de problemas en diversas áreas. Su capacidad para representar relaciones complejas entre elementos y su potencial para 
encontrar soluciones óptimas lo convierten en una herramienta invaluable en la investigación y la práctica en campos tan 
diversos como la logística, la informática, la biología y las ciencias sociales. 


13 Aspectos didácticos 


Es en la orden ECD/1172/2022, del 2 de agosto de 2022, en la que se aprueba el currículo y las características de la evaluación 
de la ESO la teoría de grafos aparece en la asignatura optativa de Matemáticas para la toma de decisiones como parte de la 
competencia específica número 2 y es un saber básico por sí mismo en la materia. 

Por otro lado en la Orden ECD/1173/2022, de 3 de agosto, por la que se aprueban el currículo y las características de la 
evaluación del Bachillerato encontramos la teoría de grafos en la asignatura de matemáticas dentro del sentido espacial. Es 
especialmente interesante trabajar este tema en bachiller aunque solo fueran los conceptos básicos y sus aplicaciones. Además 
tal como indica el currículo puede ser un medio para presentar una de las aplicaciones del uso de matrices. 
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1 Introducción 


La operaciones aritméticas elementales dieron lugar a algunas constataciones empíricas sobre la divisibilidad. Pero ni los 
babilonios (expertos en álgebra) ni los egipcios (con su acrobático cálculo con fracciones) fueron capaces de dar reglas 
rigiendo estas propiedades. Es a los griegos a quienes corresponde la iniciativa en este campo. Los libros VII y IX de Euclides 
contienen exposiciones magistrales de bellos descubrimientos sobre divisibilidad. Así pues la existencia del máximo común 
divisor (m.c.d.) es demostrada y estos libros contienen el conocido ” Algoritmo de Euclides”. También prueba la existencia 
de infinitos números primos , ofreciendo un procedimiento de construcción de números pares perfectos a partir de ciertos 
números primos. Si bien Euclides no llegó a demostrar el teorema general sobre la existencia y unicidad de la descomposición 
en factores primos, sí demostró explícitamente que todo entero es divisible por un número primo. Parece ser que Euclides no 
llegó a enunciar el teorema general debido solamente a una carencia de terminología y notación adecuadas para las potencias 
cualesquiera de un número entero. 

Con respecto a los números primos tenemos que resaltar que han sido objeto de estudio durante siglos debido a su aparente 
falta de patrón discernible en su distribución. Desde la antigúedad, se ha especulado sobre la existencia de un patrón oculto 
en la secuencia de números primos, una melodía subyacente que solo los matemáticos más hábiles pueden descubrir. Así es 
como han surgido diversas teorías y conjeturas relacionadas con los números primos. Una lectura recomendable sobre ellos es 
”La música de los números primos” de Marc du Satoy que realiza una recorrido histórico mostrándonos cómo la investigación 
de los números primos nos ha llevado a hallazgos más allá de los esperado. Cabe destacar las contribuciones de Fermat en 
este campo (S.XVIT) formulando numerosas conjeturas (alguna de ellas se demostraron y otras resultaron estar equivocadas). 
Su teorema más famoso establece que no existen soluciones enteras postivas para la ecuación 1” + y” = z” cuando n es un 
entero mayor que 2. Este teorema se mantuvo como una conjetura durante más de tres siglos hasta que fue demostrado por 
Andrew Wiles en 1994, utilizando técnicas complejas de la teoría de números y la geometría algebraica. También hay que 
resaltar la famosa conjetura de Goldbach (s.XVIITT), que sugiere que todo número par mayor que 2 puede ser expresado como 
la suma de dos números primos, así como a la escurridiza hipótesis de Riemann (S.XIX), que ofrece una posible explicación 
a la distribución de los números primos. Otra gran aportación fue el teorema de Sophie Germain (S.XIX) al último teorema 
de Fermat: desmotró que si n es un número primo tal que 2n + 1 es primo, entonces el primer caso del teorema (cuando 
ninguno de los número x,y,z es divisible para n) es verdadero. 

Aunque la descomposición en factores primos era conocida y utilizada desde la antigúiedad, a pesar de ello hubo que 

espera a que en 1801 Gauss hiciera la demostración general en sus ”Disquisitiones arithmeticae”, tratado en latín de teoría 
de números, en el que desarrolla toda la teoría conocida como álgebra de las congruencias y en el que la notación empleada 
es la misma que seguimos empleando hoy. 
Los números negativos aparecieron tardíamente si se les compara con los irracionales. Surgieron por primera vez en la India, 
cerca del siglo VII, durante el período clásico hindú. Fue Brahmagupta quien desarrolló formalmente una teoría de los 
números negativos y su uso en cálculos aritméticos y algebraicos. Inicialmente, los matemáticos indios utilizaban palabras 
para referirse a números negativos, como <«deudor> o «deuda>. No fue hasta el siglo XV que los alemanes comenzaron 
a utilizar símbolos como -3 para representar números negativos, mientras que en Italia se usaban los prefijos p y m. La 
evolución de los números negativos ha sido interesante, ya que inicialmente se consideraban abstracciones matemáticas sin 
sentido físico. Por ejemplo, Stifel en el siglo XVI realizó una de las aportaciones más valiosas en su obra al tratamiento de 
los números negativos pero se negaba a considerarlos raíces de una ecuación, llamándolos numeri absurdi. Fue en este siglo 
cuando se asentó la aceptación casi definitiva contribuyendo a ello de modo especial una gran figura del momento: Francois 
Viéte. 

En los números naturales la operación a — b solo es posible si a > b. Los números enteros van a resolver este y otras 
deficiencias de los números naturales. 


2 Números enteros 


2.1 Construcción del conjunto de números enteros a partir Nx N 


La construcción del conjunto de los números enteros Z consiste en encontrar un conjunto con una operación interna (+) 
inducida en N, y en el que todo elemento de Z tenga simétrico respecto a la suma, de manera que la ecuación a +x = b 
admita siempre solución. 


2.1.1 Equivalencia de pares de números naturales 


Consideremos el conjunto NxN = [(a, b)|a € NAL € N?. Sobre éste se define la relación R tal que (a, b)R(c, d) S a+d = b+c. 
Es una relación de equivalencia: R es reflexiva, simétrica y transitiva. Cada uno de los subconjuntos de N x N formados por 
todos los pares de números naturales equivalentes entre sí constituyen las clases de equivalencia [(a,b)] y cada uno de los 
elementos de la clase es un representante de dicha clase. 


[(a, b)] =((m,n) € N x N|(m,n)R(a, b)) 
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2.1.2 El conjunto de los números enteros 


Se llama número entero a cada una de estas clases de equivalencia. El conjunto cociente N x N/R formado por todas las 
clases de equivalencia se denomina conjunto de los números enteros Z. Dado (a,b) € N x N Se pueden dar tres casos: 


e a > b: En este caso existe m E N tal que a =b+m. Entonces se verifica (a, b)R(m, 0).Todos los elementos de [(m, 0)] 
son de la forma [(m, 0)] = [(b + m,b)/b € N) y siendo su representante canónico (m, 0). Al representante de [(m, 0)] lo 
denotaremos con el símbolo +m, o simplemente,m. El conjunto Z+ = [[(m,0)]/m € Nj lo llamaremos conjunto de los 
números enteros positivos. 


e a <b: En este caso existe n E N tal que a+mn= b. Entonces se verifica (a, b)R(0,n).Todos los elementos de [(0, n)] 
son de la forma [(0,n)] = ([(a, a +n)/a € N] y siendo su representante canónico (0,n). Al representante de [(0,n)] lo 
denotaremos con el símbolo —n. El conjunto Z” = ([(0,n)]/n € Nj lo llamaremos conjunto de los números enteros 
negativos. 


e a = lb: Se verifica que (a,b)R(0,0). Todos los elementos de [(0,0)] son de la forma [(0,0)] =4(a, a)/a € N? y siendo su 
representante canónico (0,0). Al representante canónico de [(0,0)] lo denotaremos con el símbolo 0. 


Ahora ya estamos en condiciones de afirmar que Z = Z*UJO)UZ”. Dos elementos son del mismo signo si ambos pertenecen 
aZ* oa Z” y son de signo distinto si uno pertenece a Z* y el otro a Z”, o viceversa. 


2.1.3 Representación gráfica de los números enteros. 


Los puntos que representan pares equivalentes están situados en semirrectas paralelas a la bisectriz. El punto origen de cada 
semirrecta es el representante, en OX los enteros positivos y en OY los negativos. Si prolongamos las semirrectas hasta 
que corten al eje horizontal determinan en los puntos de corte la posición de los números enteros negativos y se obtiene la 
representación lineal de Z. 


Figure 1: Representación gráfica números enteros 


2.2 El grupo aditivo de los números enteros 


Vamos a dotar a Z de la estructura de grupo y luego, mediante un orden definido en Z veremos que se trata de un grupo 
ordenado. 


2.2.1 Adición de números enteros. Propiedades. 


Definimos la aplicación suma como la aplicación: 
ZxZ>Z 


((a, db), (c,d)) + (a,b) + (c,d) = (a +c,b+ d) 


Esta no depende de los representantes elegidos (propiedad de uniformidad). Debido a esto trabajamos con los representantes 
canónicos (a, 0) + (b,0) = (a +b,0);(a, 0) + (0,b) = (a,b), positivo si a > b y negativo si a < b y (0,a) + (0,b) = (0, a + b). 
Esta definición de suma verifica las propiedades asociativa y conmutativa además de ser una operación interna y de existir 
elemento neutro (0) y elemento simétrico, que para la suma lo denominaremos opuesto (—n). Las demostraciones de las 
propiedades asociativa, conmutativa y existencia de elemento neutro son las mismas que para los números naturales. A 
continuación vamos a demostrar la existencia y unicidad del elemento opuesto: 


e Existencia elemento opuesto: V[(a, b)], [(a, b)] + [(b, a)] = [(a +b,b + a)] = [(0,0)] por tanto el opuesto de [(a, b)] es 


[(b, a)]. 


e Unicidad elemento opuesto: El opuesto de cada número entero es único. Para demostrarlo vamos a usar la reducción 
al absurdo. Sea [(a,b)], supongamos que admite dos simétricos: [(b,a)] y [(c,d)]. Por lo tanto, [(a,b)] + [(b, a)] = 
[(0, 0)] = [(a, d)] + [(c, d)] > [(a+b,b+a)] = [(a+c,b+d)]. Para que las clases sean iguales, sus elementos han de estar 
relacionados de modo que (a +b,b+a)R(a +c,b+d) lo que significa que a+b+b+d=b+a+aw+c. Aplicando la ley 
de simplificación y la conmutativa en N,b+d = a+c= (b, a)R(c, d) > [(b, a)] = [(c, d)]. Ambos opuestos son el mismo. 
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Por lo que (Z, +) es un grupo abeliano! y se denomina “grupo aditivo de los números enteros”. 
Ahora que ya tenemos a (Z, +) como grupo podemos afirmar: 


e Existe una operación inversa a la adición, que llamaremos diferencia de números enteros y se define como la suma del 
primero con el opuesto del segundo. Vm,n € Z,m—mn =m+ (—n). Esta operación es interna en Z pero no verifica las 
propiedades conmutativa y asociativa. 


e La ecuación x + m =n con m,n € Z es resoluble en Z, siendo la solución x =n + (—m). 


2.2.2 Multiplicación de números enteros. Propiedades. 


Vamos a definir en Z una operación producto tal que (Z, -) sea un semigrupo? conmutativo con elemento unidad, prolongando 
el producto definido en N. Definimos la aplicación producto como la aplicación: 
LZxZ>Z 

((a, b), (e, d)) > (a,b) - (e, d) = (ac + bd, ad + bc) 
Esta aplicación no depende de los representantes elegidos (propiedad de uniformidad). Debido a esto trabajamos con los 
representantes canónicos (a, 0) - (b,0) = (a-b,0), (a, 0) -(0,b) =(0,a-b) y (0,a)-(0,b) = (a-b,0). Esta definición de producto 
verifica las propiedades asociativa y conmutativa además de ser una operación interna y de existir elemento neutro o unidad 
(1 € Z). Por lo que (Z,-) es un semigrupo multiplicativo conmutativo y con elemento neutro. Además cumple la ley de 
simplificación: Vn,m,p € ZA ([0)n-m=n-+p=>m=p 
Esta operación tiene elemento absorbente que es cero Vn € Z,n-0=0-n=0. 
Por último, añadir que cumple la propiedad distributiva del producto con respecto a la suma tanto por la izquierda como 
por la derecha: Vp,g,r EZ. :p-(q+r)=p:q+p:TA(p+q):?T=p:r+q:7 


2.3 El anillo de los números enteros 


(Z, +, -) es un anillo abeliano unitario? que cumple las siguientes propiedades: 


e No posee divisores de cero VWm € Z,m:+*0=0yWm,neZ,m:n=0>m=0Vn=0 
(Z,, +,-) es un dominio de integridad * 

Va,bEe Z,a-(—b) =—(a-b) = (—-a)- (b) 

Va,bEe Z,(—a) -(-b)=a-:b 


Es distributiva con respecto de la resta Va,b,c€ Z,a:(b=c)=a-b=a:cA(a—b)-(c)=a:.c—b:c 


Por ser (Z,+,-) un dominio de integridad, la ecuación a + x = b si admite solución (como hemos visto que así es), es 
única. 


2.4 Orden en Z. Propiedades 


Dados dos números enteros a y b se dice que a es menor o igual que b (a < b)si y sólo si (b— a) € ZFU(O). Esta es una 
relación de orden total porque cumple las propiedades reflexiva?, antisimétrica? y transitiva. 

Todos los elementos de Z son comparables (propiedad conexa), es decir Va,b € Z,a <bvb< a. Por lo tanto, Z está 
totalmente ordenado por la relación < y cumple las siguientes propiedades: 


e La relación de orden es independiente de los representantes elegidos 
e El orden total es compatible con la adición y (Z, +,<) es un grupo aditivo ordenado 


e La multiplicación en Z es compatible con < si se multiplica por un entero positivo y se invierte si se multiplica por un 
entero negativo 


Con esto (Z,+,-,<) es una anillo abeliano unitario totalmente ordenado.Además (Z,+,-, <) es un dominio de integridad 
ordenado (El O es anterior a cualquier entero positivo y posterior a cualquier entero negativo y todo entero negativo es anterior 
a cualquier positivo). 


lun conjunto de elementos junto con una operación que satisface cinco propiedades: interna, asociatividad, elemento neutro, inversos y 


conmutativa. Abeliano=Conmutativo. 

conjunto junto con una operación binaria que satisface la propiedad de asociatividad 

3es un conjunto con dos operaciones que cumple con las siguientes propiedades: interna, asociatividad y conmutatividad para ambas operaciones, 
existencia de elemento neutro para la primera, existencia de inverso para la primera para cada elemento y la propiedad distributiva. 

tes un tipo especial de anillo conmutativo que no tiene divisores de cero. Además se cumple la propiedad de cancelación del producto: si el 
producto de dos elementos es cero, entonces al menos uno de los elementos debe ser cero 

5cada elemento del conjunto sobre el cual está definida la operación está relacionado consigo mismo bajo dicha operación. 

significa que si dos elementos se combinan bajo esa operación y el resultado es igual en ambos sentidos, entonces esos dos elementos son iguales 
entre sí. 
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2.5 Isomorfismo de N con Z*+ 


Sea la aplicación: 
f:¿¡N=>Z* 


n > (n,0) =+n 
se demuestra fácilmente que es un homomorfismo biyectivo, es decir que N es isomorfo a Z*, con lo que podemos considerar 
N incluido en Z. 
2.6 Valor absoluto de un número entero. Propiedades 


La aplicación 
I:Z>N 


In] recibe el nombre de valor absoluto y es: 
eInl=nsin>0 
eIn|=-—nsin<0 
e In|=0sin=0 

Además cumple las siguientes propiedades: 
eVneZ, In >0A|[n|=0>n=0 
e Vn € Z,n< [nl tal que si n€ Z* >m=|n| y sine Z” >-—n= [nl 
e In] =|-n|,Vn e Z 
elInj<asS—a<n<a 

Con estas propiedades se puede probar que Va,b € Z: 
e —la +b| < la| — [b] < |a +b| < la] + |b] 
+ la-3]= a] 


3 Divisibilidad 


3.1 El conjunto de los números naturales 


Sean a y b números naturales, con b 4 0, se dice que a es divisible por bo a es múltiplo de b o b es divisor de a si 3d € N tal que 
a =b-d. También se expresa como bla. Teniendo en cuenta que de la definición tenemos que Vn € N, 1|n y aJ0,Va € NA (0). 
Sea el conjunto de múltiplos m(a) = [n - a, Vn € Ni = (4) tenemos las siguientes propiedades: 


e Vn eN,n=ñ,n= 1. Es decir, todo n es múltiplo de si mismo,y múltiplo de 1. 
e Vn ¿€N,0= ñ. Cero es múltiplo de cualquier n. 
eSia,b,..=n=>(a+b+..)=ñ 

eSia>byajbb=ñn=>(a—-b)=n 


e a=b= m(a) € m(b). Todos los múltiplos de a lo son también de b, pero no todos los múltiplos de b lo son de a. 


Análogamente se define «ser divisor de>, d(a) = [n € NA (0), Jc € Nla =c-n) con a € N. 

Se define un número primo como aquel que sólo es divisible por él mismo y por 1, y número compuesto por aquel que no 
es primo. Todo número compuesto puede descomponerse en factores primos n = a” - bf .... con a,b,... números primos. Se 
define máximo común divisor de dos o más números al mayor de los divisores comunes a todos ellos y el cálculo se lleva a 
cabo mediante la descomposición en factores primos o por el algoritmo de euclides. 

Se define mínimo común múltiplo de dos o mas números al menor de los múltiplos comunes distintos de cero y el calculo se 
lleva a cabo mediante la descomposición en factores primos. También puede calcularse a través de la relación entre el mínimo 
común múltiplo y el máximo común divisor: 


memla,b) - med(a,b) =a-b 
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3.2 En el conjunto de números enteros 


Se define como en N, es una relación de preorden (propiedades reflexiva y transitiva pero no antisimétrica). Para salvar esto 
consideramos conjuntos binarios de un número y su opuesto llamados números asociados. 

Teniendo en cuenta que los únicos números enteros que poseen inverso en Z son 1 y —1; sean a y b números enteros, 
decimos que a y b son asociados aRb si du € U = [—1,1) tal que a-u = b. Esta R define una relación de equivalencia en Z y 
produce una partición en Z en clases de equivalencia, que son los llamados números asociados, a = [b € Zla-u =b,u € U). 
Sia=0,0=(0), si a 40,a= [—a,ay, con Z/R el conjunto cociente. 

Entonces definimos la siguiente relación: Sean a,b € Z/R, decimos que alb si Je € Z tal que a. c= b. Y la relación de 
división en Z/R es un orden. En la práctica se identifica Z y Z/R, entonces la relación define también en Z un orden parcial, 
siendo suficiente considerar como elementos canónicos de cada base los números positivos y engloba la división en N. 

Tenemos ahora dos teoremas fundamentales: 


e Teorema de Bezout: Dado a,b, d € Z, si mcd(a,b) =d => 3x,y € Z tal que x-a+y:b=d. Y a y b son primos entre sí 
si y solo si mcd(a, b) = 1. 


e Teorema de Euclides: Si al(b- c) y mcd(a,b) = 1, entonces alce. 
Como consecuencia se puede probar que (Z, med, men) es un retículo distributivo por verificar doblemente las propiedades: 
idempotente, conmutativa, asociativa, simplificativa y distributiva. 
El algoritmo de Euclides nos permite obtener recursivamente su máximo común divisor: si r es el resto de la división 
entera de a por b, entonces med(a,b) =mcd(b, ri) =... =mcd(r,,0) =p 


4 Números primos 


4.1 Definición número primo. Propiedades. 


Sea p € ZX (—1,0,1), p es un número primo si los único divisores de p son —1,1,p y —p; y será un número compuesto si no 
es primo. Los números primos cumplen las siguientes propiedades: 


e p primo si y solo si —p es primo 
e Sip y q son primos y p divide a q entonces p y q son asociados 
e Si p es primo y p divide a a : b, entonces p divide a a o p divide a b (puede dividir a ambos). 


e El conjunto de números primos es infinito. Demostración: Supongamos, para alcanzar una contradicción, que hay un 
número finito de números primos. Sea p1,P2,...,Pn la lista completa de números primos. Consideremos el número 
N =p1p2::*Pn +1. Dado que N es mayor que 1, tiene al menos un divisor primo. Sin embargo, N no es divisible por 
ningún número primo en nuestra lista. Esto se debe a que, si dividimos N por cualquier primo p;, obtenemos un resto 
de 1. Esto implica que ningún número primo en nuestra lista divide NV, y por lo tanto este número sería un primo que 
no está en nuestra lista, llegando a una contradicción. 


e Criba de Erastóstenes: Para poder obtener todos los números primos inferiores a un número dado existe un método 
práctico que recibe el nombre de Criba de Erastótenes. Se escribe la sucesión de los números naturales hasta el número 
dado. A continuación tachamos todos los múltiplos de 2 comenzando en su cuadrado 2? = 4. Tras el 2, el primer 
número sin tachar es el 3, entonces eliminamos los múltiplos de 3 comenzando en su cuadrado 3? = 9. Repetimos el 
proceso hasta llegar a un número cuyo cuadrado no esté en la lista. Aquellos números que permanezcan sin tachar 
son números primos. Dado un número entero, para comprobar si es número primo sin tener que realizar la criba de 
Erastótenes, basta con comprobar ordenadamente si es divisible por los primeros números primos (2,3,5,7,...) hasta que 
se llegue a un primo cuyo cuadrado sea superior al propio número dado. 


Se llama número primario a p” con p primo y n un número natural distinto de cero y tenemos entonces el teorema fundamental 
de la aritmética que dice que «todo número compuesto se puede descomponer en un producto de factores primarios y esta 
descomposición es única salvo el signo de los factores>. Y el criterio general de divisibilidad que dice que «la condición 
necesaria y suficiente para que un numero distinto de -1, O y 1 sea divisible por otro también distinto de -1, O y 1 es que el 
primero tenga todos los factores primos del segundo con exponentes iguales o mayores”. 

Como consecuencia tenemos que el máximo común divisor de dos o más números se calcula multiplicando los factores primos 
comunes con el menor exponente y el mínimo común múltiplo multiplicando los factores comunes y no comunes con el mayor 
exponente. 
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Criterios de divisibilidad 


A continuación vamos a enumerar distintos criterios de divisibilidad y por las limitaciones de la extensión solo demostraremos 
alguno de ellos. Sea x = ap : 10% + az -101 + az -10? +... + az - 10", entonces: 


6 
6.1 


x es divisible por 2 si y solo si ag es divisible por 2. 


=> 


Sea n un entero divisible por 2 es decir: n = 2 + k y 
n= ay10* + az 1014 --+a,10+a) 
2k = az 10* + az 1101 + ---+a,10+45 
2k = 10(a, 101 + ay 102 +---+41)+40 
2k — 10 (ay 10'1 + ay 1102 4 ..-+ 41) = 4 
a 
2k-—2-5(a) = ay 
2(k — 5(a)) = ao 


Así a, es par. 


“e 


Sea n = ay 10* + a, 10? + .--+ a,10 + a, un entero donde su último dígito es par 
decir: a, = 2m 
n= ay10* + az 1101 +--+a,10+4 

n= aj10* + az-,101 4.4 a,104+2m 

n= 10(a, 101 + az 102 4 ..-+ a,) + 2m 

n=2-*5(ay10'1 + az 1102 + ..--+ a,) + 2m 

Pp 
n=2p+2m 


zx es divisible por 5 si y solo si ay es divisible por 5. Demostración: Sea n un número entero positivo n = 10q + r con 
0 < r < 9 representando el dígito de las unidades. > n = 5p;5p — 10q = r => r debe ser múltiplo de 5, es decir, 0 ó 5, 
asó que tenemos o bien n = 10q (múltiplo de 5) o bien n = 10q + 5 = 5(2q + 1) (múltiplo de 5). 


zx es divisible por 3 si y solo si ay+a1+...+aj es divisible por 3. Demostración: Debemos notar que VI > 1,10'—1 = 9(1..1) 
tal que 1 se repite lveces. Entonces: 


7 — (dy Pais)... + ax) = (100 Map + (MS Daz +... + (104 — 1)az 


x—(a9+a1 +... +4) = 9a1 + 11a2 +... + 1..1ag) 


El lado derecho de la ecuación es divisible entre 9, en particular, es divisible entre 3. Así que si el número es divisible 
entre 3, dy + 41 +... + az es divisible por 3 y viceversa. 


x es divisible por 9 si y sólo si ag + a1 +... + az es divisible por 9. Demostración: análoga a la del 3. 


x es divisible por 4 si y solo si ay +2- aj es divisible por 4. 


zx es divisible por 8 si y solo si ag +2- az +4: az es divisible por 8. 


x es divisible por 11 si y solo si (ay + az +...) — (a1 + a3 +...) es divisible por 11. 


x es divisible por 7 si y solo si (ay +3-a1 +2-a2)— (az +3:44+2-:45) + (06 +3:a7+2-a3)— (a9 +3:49+2-410) +... 
es divisible por 7. 


zx es divisible por 10 si y solo si ag es 0. Demostración: Sea n un número entero positivo con ag =0 => n= 10q+a0;n = 
104. 


Congruencias 


En el anillo de los enteros (Z, +, -) 


Sea (m) un ideal de Z; a y b en Z, decimos que a es congruente con b módulo m (a = b(m)) si y solo si m|(a—b). Esta relación 
es de equivalencia y produce una partición de Z en clases de equivalencia, clases congruentes módulo m que se denota [a],,, o 
simplemente [a], con conjunto cociente Z/(m). Luego a es congruente con b si dan el mismo resto positivo al dividirlos por 
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m. Como consecuencia tenemos que las clases congruentes módulo m son los m restos distintos que obtenemos al dividir los 
números enteros por m, es decir Z/m = (0,1,....m— 1), que es el conjunto de las clases de restos (residuales) módulo m. 
(Z/(m), +, -) es un anillo conmutativo con elemento unidad, donde [al]. + [b],m = [a + bjm y [al - [b]m = la - blm. Z/(m) no 
es en general dominio de integridad, aunque será si m es primo. 

La relación ser congruente módulo m es compatible con la suma y el producto de Z y se cumple la propiedad cancelativa 
respecto a la suma . La propiedad cancelativa para (Z/m,-) se da de manera que si [a],,, - [cm = [b]» - [clm(m) en Z/m 
entonces [al»m/mca(m,c) = llm/meca(m,c)- Un caso especial es cuando mcd(m,c) = 1, ya que entonces se cumple la propiedad 
cancelativa para el producto en Z/m: si [a], - [c]m = [bla - [cm => lam = [b]m. Si m es primo, (2/m, -) tendrá la propiedad 
cancelativa del producto para todo c < m o que no sea múltiplo de m. 


6.2 Sistemas de números incongruentes 


41, ..., 4 E Z es un sistema de números incongruentes (módulo m) si los restos potenciales de sus divisiones por m son todos 
distintos y es completo si k = m; el mas sencillo es (0,...,m— 1). Se cumple que si az,..., 4x € Z es un sistema de números 
incongruentes (módulo m), con mcd(m,n) =1yb€Z =a1:n+b,...,ax -n+b también es sistema de números incongruentes 
(módulo m). Y si k =m es completo. 


6.3 Congruencia de Fermat 


También conocida como pequeño teorema de Fermat, aunque fue demostrado por el matemático y astrónomo suizo Leonhard 
Euler en 1736. Su demostración es una de las primeras aplicaciones importantes de la teoría de congruencia modular. Este 
afirma que si p es primo y n no es múltiplo de p entonces n?=! = 1(p). 

Para demostrarlo vamos a considerar los primeros p — 1 números múltiplos de n, es decir, n,2-n,3-n,..., (p—1)-n. Entonces 
si2-n = k(p) y 3-n = Kk'(p) entonces k H k'(p) porque si 2-n = k(p) y 3-n = k(p) entonces,aplicando la propiedad cancelativa 
y como n no divide a p, 2 = 3(p) y esto es una contradicción. 

Esto se puede generalizar para el resto de los múltiplos de la siguiente manera: 


1:nN= ki(p), 1, k; e (1, «3; DE 14, vi == 7, ki A kj 
Si desarrolláramos esta expresión tendríamos: 
n= k1(p) 
2.n= ka[p) 


(2 1) ¿n= kp-1(p) 


Si multiplicamos los términos obtendremos: 
2-3 (p ANA > o kp-1(p) 


Recordemos que todos los k; deben ser distintos, por lo cual en el orden que sea tenemos la multiplicación de todos los 
números de l a p— 1, al igual que en el término de la izquierda, siendo esta expresión (p — 1)!: 


(p-1)!-nP* = (p— 1)(p) 


Como cada uno de los números en (p— 1)! no son divisibles por p, ya que p es primo, con lo cual podemos aplicar la propiedad 
cancelativa obteniendo: 
nP=1=1(p) 


Tal como queríamos demostrar. 


6.4 Aplicaciones actuales 


Las congruencias y los números primos tienen aplicaciones fundamentales en criptografía, el estudio de técnicas para asegurar 
la comunicación y la información. En particular, en sistemas de clave pública como el algoritmo RSA, las congruencias 
son esenciales para cifrar y descifrar mensajes. La seguridad de estos sistemas se basa en la dificultad computacional de 
factorizar números grandes en sus factores primos, lo cual es esencialmente un problema de teoría de números. Por lo tanto, 
los números primos y las congruencias proporcionan una base matemática sólida para la seguridad en las comunicaciones 
digitales imprescindibles para la realidad actual. 
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7 Aspectos didácticos 


Es en la orden ECD/1172/2022, del 2 de agosto de 2022, en la que se aprueba el currículo y las características de la evaluación 
de la ESO. Dentro de los saberes básicos es el sentido numérico donde especialmente se desarrolla la primera parte de este 
tema (enteros, divisibilidad y primos). Este sentido se trabajará al desarrollar las competencias específicas a lo largo de toda 
la etapa pero será especialmente en primero y segundo de la ESO donde se aplicarán las propiedades y operaciones con los 
números enteros y las propiedades de divisibilidad y de los números primos. Con respecto a las congruencias están recogidas 
en la asignatura optativa de Matemáticas para la toma de decisiones: en la competencia específica 1 y en el saber básico de 
aritmética modular y criptografía. 
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1 Introducción 


El ser humano hizo uso de los números racionales antes que de los números enteros. Este hecho se debe a la necesidad de 
representar partes fraccionarias de unidades al resolver problemas de la vida real relacionados con la medida. La aplicación 
práctica de los números racionales se remonta a épocas antiguas, aunque su formalización y estudio matemático fueron 
desarrollados en etapas posteriores. 

Aunque se supone que su uso fue anterior, fue en la Edad de Bronce donde se observan los primeros vestigios del uso de 
fracciones. Este período histórico puede considerarse como pionero en la manipulación de fracciones, ya que era necesario 
para diversas actividades cotidianas, como el comercio, la construcción y la mediciones de terrenos. 

Las primeras referencias escritas sobre fracciones se encuentran en los Papiros del Rhin (1550 a.C.), donde se emplea una 
notación para representar fracciones del tipo Z. Además, en Mesopotamia también se utilizaron las fracciones, aprovechando 
su sistema de numeración posicional, lo que permitió un cálculo eficiente y un registro detallado de acuerdos comerciales y 
medidas. 

Sin embargo, a pesar de su uso extendido en otras culturas, llama la atención la falta de consideración de las fracciones por 
parte de los griegos antiguos en su desarrollo matemático. Aunque los griegos eran conscientes de las relaciones numéricas 
que podrían expresarse como fracciones, como lo evidencian algunas demostraciones geométricas de la época, su enfoque 
principal estaba en los números enteros y en la geometría pura. 

A partir de finales del siglo XV y comienzos del siglo XVI, se adoptó la forma moderna de representación de las fracciones, 
expresando cada cantidad por un número m de unidades que contiene y el número n de unidades que contiene la unidad 
fundamental. Esta representación se realiza bien mediante el par (m,n) o mediante la notación 4%, donde m se denomina 
numerador y n denominador. Este sistema de representación proporcionó una manera más clara y uniforme de trabajar con 
fracciones, estableciendo las bases para su estudio sistemático en la matemática moderna. 

En este tema tomamos como conocidos los conceptos relativos a los números enteros: divisibilidad, números primos, etc... 
En el dominio de integridad (Z,-) de los enteros la ecuación b-w = a con b distinto de cero y a,b € Z no siempre tiene 
solución. Surge pues la necesidad de dar solución a todos los casos de la ecuación anterior, en otro términos, poder efectuar 
la división a/b para todo b distinto de cero. 


2 Construcción de los números racionales Q 


Llamemos a Z x Zy = ([(a,b)la € ZAb E Zo) el conjunto de fracciones, dónde Zp = ZA (0). Definimos una fracción como un 
par de números enteros (a,b) tal que b 4 0, denominando a como numerador y b como denominador y se representa %. 

En el conjunto Z x Zy se define una relación de equivalencia =: £ = 5 sia: d=b+c ya que cumple: reflexiva, simétrica, 
y transitiva. La relación permite clasificar el conjunto de las fracciones Z x Zg en clases de equivalencia. Se llama número 
racional a cada una de estas clases de equivalencia. Cada fracción es una representación del número racional al que pertenece. 
El conjunto cociente formado por todas las clases de equivalencia recibe el nombre de conjunto de los números racionales 


Q=ZxZo0/ -. 
e Proposición 1: Si h es un número entero distinto de cero entonces $ = a Esto implica las siguientes consecuencias: 


— Todo número racional tiene representación con denominador positivo. 


— Dados dos número racionales, siempre es posible hallar dos fracciones que representen a los mismos que tengan el 
mismo denominador. 

— Dados dos número racionales, siempre es posible hallar dos fracciones que representen a los mismo que tengan el 
mismo numerador. 

— Todo número racional tiene un representante 7 tal que mcd(a, b) = 1, es decir que el denominador y denominador 
son primos entre sí. A este representante se le llama fracción irreducible y se adopta como representación canónica 
de una número racional aquella fracción irreducible con denominador positivo. 


e Proposición 2: Las fracciones de tipo > forman una clase, es decir un número racional, con b X% 0; El conjunto de estas 


es el número 0. 
e Proposición 3: Las fracciones de la forma > constituyen una clase, es decir un número racional, con b 4 0; el conjunto 


de estas es el número 1 


3 El grupo aditivo de los números racionales 


Sean a y 6 números racionales o clases de las que 7, £+, ... Son representantes de la clase a: y Y 7 ... SON representantes de 
T 1 
la clase $. La adición en Q se define: 


+:0x0>0 
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La suma a + $5 es independiente de los representantes elegidos para obtener dicho suma (Propiedad de uniformidad). 


3.1 Propiedades 


En virtud de la uniformidad, siempre podemos tomar como representante de los números racionales considerados, fracciones 
con el mismo denominador. $ + ? == ata Esta suma a + b cumple las propiedades de la suma en Z. 

La adición en el conjunto de los número racionales es un grupo aditivo abeliano (Q, +). Dados dos números racionales a: y 
$, por ser Q un grupo aditivo, la ecuación a + x= P admite solución en Q, pues sumando a los dos miembros de la ecuación 
0 € Q tenemos —a + 0+xu=-—0Q+ 6, siendo x =P —Q. Siendo está la operación de sustracción, una operación interna 


pero que no verifica la propiedad conmutativa. en términos de aplicación se puede definir: 
-:Q0x0>0 
(0,8) >0a—P=a+ (+8) 


4 Multiplicación de los números racionales 


Sean a= 5, y P= 2 dos números racionales. Se define producto de los números racionales como una aplicación: 
-:QxQ0>0 
a b a-b 
GS O 
La multiplicación de los números os verifica la propiedad de uniformidad ya que tomando cualquier otra representación 


/ bh abhhk ab 
de alpha y beta, con h,h? € Zo, ¿7 e PA APRA 


4.1 Propiedades 


Además de la propiedad uniforme, como consecuencia de que la multiplicación en los enteros es conmutativa y asociativa 
podemos demostrar que en los racionales se verifica que es: interna, conmutativa, asociativa, existe elemento neutro (1) y 
existe elemento simétrico para a = FG que es Y = an Sia=0,% 2 Z x Zo. Así pues, todo elemento de Q, excepto el 
nulo tiene simétrico. Por tanto el conjunto Qu = QA (0) con la operación multiplicación es un grupo abeliano (Qo, -). Sin 
embargo, (Q, -) es semigrupo conmutativo con elemento unidad. Se verifica, al igual que en (Z, +, +), la propiedad distributiva: 
a-(B+y) =a:B+a-y, Va, B,y € Q. Del mismo modo, se cumple la propiedad distributiva respecto a la resta o sutracción: 


a-(8—y) =4a- PB =0- y, Va, B, y EQ. 


5 El cuerpo de los números racionales (Q, +, -) 


5.1 Estructura del cuerpo 

Un cuerpo es un conjunto A en el que están definidas dos operaciones internas (x) y (o), tal que (4, x, 0), si: 
e (4,x) grupo conmutativo (existe elemento neutro) 
e A sin el elemento neutro de * es grupo respecto de o 
e La operación o es doblemente distributiva, respecto a x 


Si además la operación o es conmutativa, de dice que el cuerpo es conmutativo. Por lo tanto, podemos garantizar que (Q, +, -) 
es un cuerpo conmutativo. 


5.2 División en Q 


Dados dos números racionales a y 5, la ecuación a+ - 1 = f con a X 0 admite solución en Q pues multiplicando a ambos lados 
de la ecuación por o” inverso (simétrico de la multiplicación) de a: en Q, resulta a - a. - x= 08, como o - a = 1 entonces 
x= 0/8 que también se expresa como cociente de beta por alpha, PB: Q. 

[2 a B- a! 2% a! b:a! 


Sia= 57 yPB= L, se tiene que $ : ARS 


vwoa da” 
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5.3 Q como ampliación de Z 


Anteriormente veíamos que el conjunto Q suponía una extensión del conjunto Z. Ahora vamos a comprobar que el cuerpo 
(Q, +, -) es una extensión del anillo (Z, +, -). Para ello vamos a definir una función f entre (Z,+,-) y (Q, +,-) tal que sea un 
homomorfismo inyectivo: 
él : (Z, +, 2) DES (Q, Es e) 
z 


Demostramos que: 


e f es inyectiva ya que Va,bEe Z f(a) = f(b) >= >a=b 
e Va, beZ fla+b)= HH =2+?= f(a) + £(b) 


e Va, beZ fla:b)=%=2.2= f(a) - £(b) 


Por tanto, Ff(Z) C Q es un subanillo de Q isomorfo a Z, o lo que es lo mismo, Q es una extensión de Z. Esta aplicación f 
nos permite identificar el entero x € Z con su racional Í € Q. Además la aplicación f conserva el orden de Z: 


b+(- 0 b — b 
a, be Zla<b>b=a>0=>b+(-a)>0=> Hl p 2 do pe 205% 
En resumen, sia<b= f(a) < f(b), por tanto f es un morfismo de orden. 
Como en Q se conservan las operaciones de suma y producto y el orden definido en Z, podemos decir que Q es una 
ampliación efectiva de Z. 


6 El cuerpo ordenado de los números racionales 


Vamos a establecer una relación de orden total en Q compatible con la de Z. En Z, la relación de orden total se define: 
n,meZ,n<m< (m=—n)€Z*,(0€Z*). Sea a = 57 € Q es racional positivo si a-b € Z* y a € Q*, en caso contrario 
es un racional negativo y a € Q”. Esta definición no depende de los representantes elegidos. Como todo número racional 
admite un representante de denominador positivo podemos reducir el criterio al estudio de sus numeradores. Así pues: 


Va € Qla=->,(a€Q* Sa>0,(a€Z*)A(aEQT7 Sa<0(a € Z7)) 


a 
b 
También se puede expresar como «a será positivo si y solo si su denominador y numerador tienen el mismo signo y —a, si es 
distinto de cero, será negativo si q; es positivo y viceversa. En (Q, +, -) la suma y el producto de racionales positivos resultan 
en racionales positivos. Respecto a la relación de orden tenemos a < PB si-=-a>0yas< Bsi Ba S< 0. Se verifican 
las propiedades: reflexiva, antisimétrica y transitiva. Es de orden total ya que todos los números racionales son comparables 
por dicha relación. Por tanto la representación de Q es lineal y todo número racional es mayor que todos los que están a su 
izquierda y menor que todos los que están a su derecha. Consecuencias inmediatas de la relación de orden: 


e Todo número racional positivo es mayor o igual que cero 
e Todo número racional negativo es menor que cero 
e Todo número racional negativo es menor que todo número racional positivo 


< no define en Q un buen orden: no existe ningún elemento que sea anterior a los demás y todo número racional carece de 
siguiente, ya que el orden de los racionales es denso como demostraremos posteriormente. No obstante (Q, <) es un retículo, 
es decir, un conjunto ordenado tal que para cada par de elementos x,y € Q existe un supremo, supíx,y) y un ínfimo, 


infíx, y). 

6.1 Propiedades de la relación de orden en Q 
e La relación de orden es compatible con la suma 
e La relación de orden no es compatible con el producto! 


e (Q,+,-,<) es un cuerpo totalmente ordenado 


e Se verifica la propiedad arquimediana, es decir, si 0 <a. < B => Jn € Nla-n > 6, por lo tanto, (Q, +, -, <) es un cuerpo 
ordenado arquimediano 


1El resultado de multiplicar dos números racionales no tiene porque ser un número mayor que éstos 
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e Si¿<$y0a€Q tal que O < a. < 1 se verifica: ¿ <a: ¿+(1-a):5< $. 


e El conjunto de los números racionales es numerable. Esto quiere decir que es un conjunto equipotentes a los naturales. 
Para demostrarlo bastaría con poner todos sus elementos en forma de secuencia infinita ya que demostraría que existe 
una biyección (condición de equipotencia) con los número naturales. En la siguiente sección vamos a ver que Q es un 
conjunto denso, ya que entre dos números racionales siempre encontramos otro número racional, por lo tanto ¿Cómo 
saber si N y Q son equipotentes? Fue Georg Cantor quien demostró que efectivamente así es. Una de las demostraciones 
que dio de tal hecho se basa en el criterio de la secuencia infinita. Para aplicarlo debía, como hemos visto, encontrar 
una forma de colocar a todos los números racionales en secuencia. Para ello primero dispuso en una tabla todas las 
fracciones, de modo que en la primera fila estuviesen ordenadas las fracciones de denonimador 1, y en la segunda fila 
las de denominador 2, y así sucesivamente. Después ideó un camino que pasase por cada una de las fracciones: 


ej 
ito 


y 

1 
bal La | 10 
e 

| 
| 
y 


Wi “ tol 
Lito 
Lo] Lo 


Ue al 


Aunque en la tabla hay repeticiones (para cada número racional hay infinitas fracciones que lo representan), siguiendo 
el camino indicado por las flechas y eliminando dichas repeticiones tendremos la secuencia de los racionales deseada. 
De tan elegante manera demostró Cantor la numerabilidad de Q (y, de paso, la numerabilidad del conjunto de las 
fracciones). 


7 Densidad del orden en Q 


Siqa=2 = ? son dos números racionales tales que a < 8 entonces existe otro número racional d tal que a < 8 < B. 
y d q 


d 
Para demostrarlo sabemos que a < 8 > 8-0 > 0. Si tomamos Ba y tomando en cuenta que el conjunto N no está acotado 


podemos asegurar que: 


¡NN 


il 
no E? > 


es decir, Pa. > L. A continuación necesitamos definir la función parte entera por abajo de un número racional «+, expresada 
la], siendo el mayor número entero igual o menor que ese número racional: 


p=la]|:(ÍpeZAQ40EQAPpS<a<p+1) 


Definimos ahora p= |n - a.| entonces 


+1 
v Ha AS <apna <A 
n n 


Aplicando las relaciones obtenidas anteriormente se cumple: 


1 +1 
B=a+(6 ases =? >0 
n on n 
Por lo tanto se cumple a <ó0< PB sió = pl. Una vez determinado d, podemos aplicar de nuevo el proceso entre dy8, 


demostrando así la existencia de otro número racional entre ambos y a la vez entre a y P. Reiterando el proceso se ve que 
entre dos números racionales existen infinitos números racionales. Por eso se dice que el orden en Q es denso. Esta propiedad 
no existe en los naturales ni en los enteros, a consecuencia de lo cual no puede hablarse del número racional anterior o 
siguiente. 


8 Sucesiones de números racionales 


Se llama así a toda aplicación a del conjunto N en Q: 


la forma de representarla sería 41, 42,43, ..., Gn O (Ay). 
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8.1 Sucesiones de Cauchy de números racionales 


Unas sucesión (a,) de números racionales se dice de Cauchy cuando para todo número racional e > 0 existe ny E N tal que 
para cualesquiera de los valores m,n > ny entonces la,, — ay | < e.? 
Al conjunto de todas las sucesiones de Cauchy de números racionales lo llamaremos S.. Tienen las siguientes propiedades: 


e Toda sucesión de Cauchy (a, ) de números racionales está acotada en valor absoluto en Q, o, si (a, ) es una sucesión de 
Cauchy, entonces existe un número racional k tal que la,,] < k,Vn € N 


e Si (a,,) y (b,,) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (a, +b,,) también es de Cauchy. 
e Si (a,,) y (b, ) son dos sucesiones de Cauchy, de números racionales, entonces la sucesión (a, —b,,) también es de Cauchy. 


e Si en una sucesión de Cauchy se suprimen los p primeros términos resulta en otra sucesión de Cauchy equivalente a la 
primera. 


8.2 Completitud 


Se dice que un cuerpo K' es completo si toda sucesión de Cauchy en K es convergente en K. Esto no oucrre en Q ya que hay 
sucesiones de Cauchy de números racionales que no convergen en Q como an = (1 + Lyn que converge al número irracional 
e. Este tipo de sucesiones convergen en el cuerpo de los número reales siendo la completitud lo que diferencia el cuerpo de 
los número reales de los racionales. 


9 Números decimales 
Llamaremos número decimal a un número de la forma: 


[e,0) 

Cc 

a+ y 0 Sci <9, ci 0 EZ 
i=1 


se representa por a.c¡caC3... y a recibe el nombre de «parte entera por abajo> del número decimal y c, son los decimales. 
Nótese que si el número se multiplica por 10, la parte entera pasará a ser a? = a -10+c, y el número se expresará ac; .c2C3..., 
es decir, los decimales se desplazan una posición a la izquierda, formando c; parte de la parte entera. 

Todo número racional se puede expresar como un número decimal (la parte entera por abajo definida anteriormente coincide 
con esta definición). Tomemos p = % € Q*, fracción irreducible y m,n > 0. En el caso de que p fuera un número racional 
negativo, podríamos expresarlo como p = —1-p' siendo p' positivo y obteniendo el número decimal a partir de este. Entonces, 
dado p existen a,r¡ € Z tal que m=a:n+r, con0< rr, <n. a es la parte entera del número decimal. Tomando ahora 
10-11 y n, existe c1,r2 € Z]10- 1, =c, -n+r3 con 0< r2 < n. Está claro que 0 < c, < 9 ya que: 

0O<r<n=>0<10-1; <10-n>0<c«:n+r32<10:n>0< ra < (10—c1)-n. Como (10—c1)-n >0 y n > 0 entonces 
10-c1 >0=><c<10 y como m,n>0>a>0=> ci >0. 

Repitiendo sucesivamente el proceso obtenemos: 


10576; -N + 141 V 


Y p se escribirá a.c¡C2C3... 

Un número decimal es exacto si tiene un número finito de cifras decimales, o, un número decimal es exacto si y solo si es 
un número racional de la forma >: Si no es exacto tendrá infinitas cifras decimales. Llamaremos periodo al conjunto más 
pequeño de cifras decimales que se repiten indefinidamente en un número decimal, se representará a.c¡tc3, siendo cacg el 
periodo. Un número decimal se llama periódico mixto si hay cifras decimales delante del periodo si hay cifras decimales antes 
del periodo y puro si no las hay. Todo número racional se puede representar como un número decimal exacto, periódico 
mixto o puro. El recíproco también es cierto. La fracción generatriz de un número decimal es la fracción irreductible (no se 
puede simplificar más) que da como resultado dicho número decimal. 

Vamos a presentar a continuación varios ejemplos de representación de fracciones a decimales (método demostración) y 
viceversa: 


e Decimal exacto: Siendo 3 existe a,r¡ € Z tal que 3=a-2+r,,0< r¡ < 2. En este caso a = 1, la parte entera, ri = 1. 


Continuamos y existe c,,r2 € Z tal que 10-1=c,-2+r23,0< r2<2. En este caso c1 =5 y ra =0, esto último indica 


que ya no has más decimales, por lo tanto ¿ expresado como decimal es 1.5, un número decimal exacto. Podríamos 


2 
: : : bo3_35_ 15 
haber deducido que es decimal exacto observando que podía expresarse Como 397, 5 = 25 = jor: 


. E . ., . . ed . . . . d 
Convertir el número decimal 1.5 a fracción es trivial, el método habitual en decimales exactos es multiplicar por 7, 


2secuencia de números en la que los términos se vuelven arbitrariamente cercanos entre sí, dado cualquier e > 0, podemos encontrar un punto 


en la secuencia después del cual todos los términos están a una distancia menor que e entre sí. Ejemplo (an) = Z 
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siendo d el número de decimales. Al desplazar d veces la posición de los decimales todos pasarán a formar parte de 
la parte entera, obteniendo un número entero. En este caso, d = 1 y 1.5 - y = $ = 3. En este caso > es la fracción 
generatriz de 1.5. 


e Periódico puro: Siendo 3, existe a,r, € Z tal que 2=a-3+r1,0<r;, < 3. En este caso a = 0, la parte entera, r, = 2. 
Continuamos y existe c¡,r2 € Z tal que 10-2=c, -3+r,0<ra< 3. En este caso cy =6 y r2 = 2. Observamos que 
ri = r2 = 2, por lo tanto al continuar el proceso obtendremos que c; = 6Vi, obteniendo un número decimal periódico 
puro 0.6. 

Para convertir el número decimal 0.6, tomamos que si x 06=>10-2=66>10-1=6+2>92=6=>u2x S 3. 

En este método la ecuación x = a, siendo a, el número periódico puro, debe ser multiplicada por 10% siendo d el número 

de decimales que formen el periodo, en este caso d = 1. Concluimos que 3 es la fracción generatriz de 0.6 


— Caso particular: cuando el periodo está formado solamente por el número 9: 


x=0.9 10.=9.9 10-=9+x>9.:=9>x=1 


Para que esto tenga sentido necesitamos una topología en Q que permita asegurar el paso al límite. Eso 
podemos hacerlo teniendo en cuenta el orden definido en Q y su densidad. Así podemos asegurar que la sucesión 
0.9, 0.99, 0.999, .... tiene por límite 1. 


e Periódico mixto: Siendo h, existe a, ri € Z tal que l =a-:15+r,,0< ri, < 15. En este caso a = 0, la parte entera, 
ri = 1. Continuamos y existe c¡,r2 € Z tal que 10-1 =c,-15+r3,0< r2 < 15. En este caso c; = 0 y ra = 10. 
Continuamos y existe c2,r3 € Z tal que 10-10= cz -15+r3,0< rz< 15. En este caso ca = 6 y r3 = 10. Observamos 
que r2 = r3 = 10, por lo tanto al continuar el proceso obtendremos que c, = 6v > 1, obteniendo un número decimal 
periódico mixto 0.06. 

Para convertir el número decimal x = 0.06, tomamos que y = 10 -x = 0.6, siendo y un periódico puro. Aplicamos la 


conversión a y, que resultará y 3 3 10-1>x 5 Encontramos que 5 es la fracción generatriz de 0.06 


2 
30 


10 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachiller. 

Este tema se desarrolla está recogido principalmente en el sentido numérico (Cantidad, sentido de operaciones, relaciones 
y razonamiento proporcional). También se trabajará en el sentido de la medida que da soporte al sentido numérico en la 
construcción de los números racionales. 

Los números racionales aparecerán a través de toda la etapa educativa (ESO y bachiller), sin embargo se introducen en 
1% eso donde se propone que el concepto de fracción debe desligarse de la idea de parte-todo para darle un sentido más 
amplio y universal. No se trata de renunciar a este significado, útil para resolver ciertos problemas, pero sí de presentar el 
racional como número. Así ayudar a comprender que un número racional puede ser además de un operador, el resultado 
de un reparto, el resultado de una medida, una razón y una probabilidad. Para ayudar al alumnado a ver el racional como 
número es importante crearle situaciones que den sentido a ese número. Este concepto ser irá desarrollando curso a curso 
alcanzando mayor profundidad, complejidad y abstracción. 
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1 Introducción 


El estudio de las sucesiones y progresiones ha sido una parte integral de las matemáticas a lo largo de la historia. Desde 
las civilizaciones antiguas hasta la era moderna, las sucesiones y progresiones han sido fundamentales en áreas como la 
contabilidad, la geometría y la física. 

Las primeras investigaciones sobre sucesiones se remontan a las antiguas civilizaciones mesopotámicas y egipcias, donde 
se utilizaron para registrar transacciones comerciales y eventos astronómicos. Más tarde, los matemáticos griegos como 
Pitágoras y Euclides profundizaron en el estudio de las series numéricas y las progresiones aritméticas y geométricas. 

Podemos destacar la ” Progresión Geométrica de Plimpton 322” es una secuencia numérica descubierta en una tableta 
babilónica de arcilla antigua llamada Plimpton 322, que data de alrededor del 1800 a.C. Fue encontrada en lo que hoy es 
Irak. Esta progresión geométrica es notable porque contiene números enteros con una razón inusualmente grande. Aunque 
el propósito exacto de la tabla Plimpton 322 no está claro posiblemente servía para resolver problemas de trigonometría. 

Durante la Edad Media y el Renacimiento, pensadores como Fibonacci y Luca Pacioli expandieron el conocimiento sobre 
sucesiones y progresiones, aplicándolos a problemas prácticos en diversas áreas. 

Hoy en día, las sucesiones y progresiones siguen siendo relevantes en una amplia gama de disciplinas, desde la informática 
hasta la teoría de números. Su estudio continúa siendo una parte activa y vital de las matemáticas modernas. Suponemos 
conocido el conjunto de los números reales así como el concepto de función. En este tema estudiaremos un tipo de funciones 
reales cuyo dominio de definición será el conjunto de los números naturales, exceptuando el 0 Nx = NA (0), aunque muchos 
autores no consideran esta excepción. 


2 Sucesiones 


Definición: Una sucesión de elementos de A (donde A puede ser N, Z, Q,R,C) es una aplicación de Nx en A: 
f:Nx=> A 


n> fín) = a, 


Dependiendo del conjunto A la sucesión recibe (N, Z, Q, R, C) el nombre de sucesión de números naturales, enteros, racionales, 
reales o complejos, respectivamente. Al margen de la definición formal de sucesión, esta puede verse como una cadena de 
números ordenados unos tras otros, pudiendo prolongarse o no indefinidamente. A cada uno de los elementos de la sucesión 
se le llama término. Al número a,, se le llama término n-ésimo y la sucesión se representa por (a, 52, o simplemente (a,,). 
Como ejemplos de sucesiones podemos citar: 


e 1,3,5,7,... (los números impares) 
e 1,4,9,16,... (los cuadrados perfectos) 


En definitiva, una sucesión es una colección de número en el que a cada uno de los cuales se le ha puesto una etiqueta que 
indica el lugar que ocupa. La forma de etiquetarlos es asignándoles un número natural. 


3 Término general y forma recurrente 


3.1 Término general 


Hay sucesiones, como la de los cuadrados perfectos, para las que se puede obtener la expresión en un término cualquiera a,, 
en función del lugar que ocupa n y sin necesidad de conocer los anteriores. En el ejemplo citado, 1, 4,9,16,..., (an =1n?). De 
esto modo, sabemos que ag5 = 95? sin necesidad de conocer términos anteriores. Por tanto, llamamos término general de 
una sucesión a la fórmula o expresión matemática que permite obtener cualquier término de la sucesión en función del lugar 
que ocupa. Por ejemplo: 

an =1n?,Vn € Nx (los cuadrados perfectos) 


An =2n—1,Vn e Nx (los números impares) 


3.2 Forma recurrente 


En otras sucesiones no resulta tan obvio obtener a primera vista el término general. Pero sí que es posible que su determinación 
venga dada por una ley de recurrencia. 

Definición: Una sucesión es recurrente de orden k su conocemos los k primeros términos a;,42,..., 4 y cada termino 
siguiente viene dado en función de los k anteriores: 


An = F(An-—1, An-2) -»:, An—k), Vn > k 


Esta ecuación se llama ecuación de recurrencia de orden k. Veámos algunos ejemplos: 
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e La famosa sucesión de Fibonacci: 1,1,2,3,5,8,... es una sucesión recurrente de orden 2: 
41 = 42 =1,4n = An-1 + An-—2, Vn > 2 


Debemos destacar porque esta sucesión es tan relevante. Desde la disposición de las hojas en una planta hasta la forma 
en que crecen los pétalos de una flor, la secuencia de Fibonacci aparece en numerosos patrones naturales, lo que la 
convierte en un fenómeno fascinante para los biólogos y ecologistas. Además, la relación de los términos consecutivos 
de la sucesión converge hacia la proporción áurea, una constante matemática que ha capturado la imaginación de 
artistas, arquitectos y diseñadores a lo largo de la historia por su estética y armonía. Además, la sucesión de Fibonacci 
tiene aplicaciones en campos tan diversos como la teoría de números, la informática, la teoría de grafos y la economía, 
demostrando su versatilidad y relevancia en el panorama matemático moderno. 


e El factorial de los números naturales forma una sucesión: 1,2,6,24,120,... que es recurrente de orden 1: 


as =1,4, =N-:4n-1, vn > 1 


e Otros ejemplos de sucesiones recurrentes son las llamadas progresiones, que estudiaremos posteriormente con más 
detalle 


Nos centraremos en las sucesiones recurrentes de orden k, a, = f(an-1,..., nx), en las que la función f es lineal, esto es, 
las de la forma: 
An = 01 :An-1 +09 :4n-2+... +0: An-k, vn > k 


con A; ER y as,..., az conocidos. 

Vamos a ver cómo resolver esta ecuación de recurrencia que permitirá obtener el término general de la sucesión. La clave 
está en considerar la sucesión a, = 1”, siendo r un número a determinar (real o complejo) que obtendremos imponiendo que 
la sucesión satisfaga la ecuación de recurrencia. Es decir: 


Vn > k,d, =01 :GOn-1 + 02:0n-2+... FQk*An—k 


>r"=a ia? pap rra 
> E -—aRA as  ?—.— AZO 
=> mor. (re = 09 PP" 9 ré2— ...—)=0 


Por tanto, o r =0 (solución trivial) o r es solución de la ecuación: 


re AL — A 


llamada ecuación característica. 

Por el teorema fundamental del álgebra, en el que todo polinomio p(x) de grado k tiene k raíces y ya que toda combinación 
lineal de soluciones es también una solución se puede demostrar entonces que nuestra sucesión a, puede expresarse como 
una combinación lineal de términos de la forma c;, - rf? con ¿= 1,...,k siendo k la multiplicidad de r y con r variando en el 
conjunto de soluciones de la ecuación característica siempre que las raíces r, sean distintas. Esto es, 


k 
An = ) Ci Yi 
i=1 


. En el caso de raíz doble r en la ecuación característica de grado dos, la expresión del término general será: a, = (c, +x:c2)r”. 
Los coeficientes de la combinación lineal c, se obtienen a partir de los a;,..., az conocidos. 
Veamos un ejemplo, vamos a calcular el término general de la sucesión de Fibonacci, recordamos: 


41 = 49 = 1,4 = Apn-1 + Ap-2, YN > 2 
En efecto, An — An—1 — An-2 = 0. Por tanto su ecuación característica es r? — r — 1 = 0, cuyas soluciones son: 


E A 
=p A 


ql 2 
Así, podemos escribir a,, = C1 : rf + ca - r3, donde cy e ca se determinan imponiendo a; = az = 1. Resolviendo el sistema 
obtenido e; = , ce, = == Por tanto el término general de la sucesión de Fibonacci queda: 


V5? 
1 (48m 1 ENS 
JE 2 5 2 


)",Vn € Nx 


An = 
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3.3 Sucesiones sin término general ni ley de recurrencia 


Existen otras sucesiones para las que no se puede encontrar su término general ni una ley de recurrencia que las defina, por 
ejemplo: 


e 1,2,3,5,7,11,13,17,19,... (sucesión números primos) 
e 1,4,1,5,9,2,6,5,... (sucesión de las cifras decimales del número 7) 


En estos casos su determinación viene dada por un enunciado. 


4 Características generales de las sucesiones 


4.1 Límite de una sucesión 


Una sucesión (a, tiene límite 1, tiende a l o converge a 1 cuando n tiende a infinito y se simboliza por lim a, = l si 
n—>o00 


Ve > 0,3Iny E Nx Vn > no, la, — 1] < e, donde || representa una norma en A. Si una sucesión no es convergente, se llama 
divergente. La definición de convergencia viene a decir que a partir de un cierto término, la sucesión se acerca a su límite 
tanto más cuanto mayor sea el n considerado. Veamos algunos ejemplos: 


e La sucesión a, = 5 es convergente pues el lim a, =0 


n—00 
de m? . . 
e La sucesión a, = 21 88 divergente pues lim a, = 00 
n—>00 


e La sucesión a, = (1+ +)” es convergente pues lim a, =.e 
n—00 


4.2 Sucesión acotada 


Una sucesión La, | está acotada superiormente si Jk € Ala, < k,Vn € Nx. Análogamente una sucesión (a, ) está acotada 
inferiormente si 3Jk € Ala, > k,Wn € Nx. Una sucesión (a, | está acotada si lo está inferior y superiormente. Cualquier 
sucesión convergente está acotada, sin embargo su recíproco no es cierto. Veamoslo en un contraejemplo: la sucesión 
An = (-1)” está acotada por 1 superiormente y por —1 inferiormente, sin embargo es divergente ya que no existe lim ED”, 


ya que se trata de una sucesión oscilante. 


4.3 Sucesión creciente y decreciente 


Una sucesión (a, | se dice monótona creciente si y < Gn +1, Vn E Nx y se dice es estrictamente creciente si 4 < 4n+1, Vn € Nx. 
Las definiciones de sucesión monótona decreciente y estrictamente decreciente son análogas. 

Hay que tener en cuenta que las definiciones de sucesión acotada, creciente y decreciente no tienen sentido cuando la 
sucesión se define de Nx en C puesto que en el conjunto de los números complejos no existe el orden. 


4.4 Concepto de serie 


Dada una sucesión (fa, ) se llama serie definida por (a, a la pareja de sucesiones ([a,p,(5S,,)), cumpliéndose que S,, = 
a +42 +... + dr, donde [S,,+ se denomina sucesión de sumas parciales de a,,. 

Se dice que la serie es convergente si la sucesión (S,,) es convergente. Al límite de (5,,) se le llama suma de la serie. Se 
denota por A a. , tanto la serie como su suma en caso de ser convergente. Una serie muy importante es la serie geométrica 
que estudiaremos más adelante. 

El hecho de que el límite de la sucesión sea O es una condición necesaria, pero no suficiente para la convergencia de la 

E S A > o) A . s Pta 00 1 . 
serie. Es decir, Si la serie )7,_¡ an converge > lim a, = 0. Por ejemplo, la serie armónica )7,,_, ; es divergente pese a 

n—00 


que lim =0. 
n—>>00 


5 Progresiones Aritméticas 


5.1 Progresiones aritméticas ordinarias 


Se llama progresión aritmética a la sucesión de número reales en que cada término, excepto el primero, se obtiene del anterior 
sumándole una constante llamada diferencia: 
An+1 = An, + d,Vn € Nx 
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En este caso podemos obtener el término general de manera muy sencilla, primero observamos qué sucede en los primeros 
términos: 
a =41 +d;¡a43 = 42 +d= a1 + 2d; a4 = a3 +d= a1 +3d 


Podemos deducir que: 
An =41 +d(n— 1) 


Pero lo demostramos por inducción: 


Adn+1 = 4 +d=a1+d(n—-1)+d=a1 +nd= a1 + ((n+1) — 1)d 


5.1.1 Formas de definir una progresión aritmética 


Una progresión aritmética, como toda sucesión, queda definida conociendo su término general. No obstante, debido a sus 
características, también queda definida conociendo: 


e Un término az cualquiera y la diferencia d Sea a, = a1 +d: (n— 1) el término general de una progresión aritmética y 
sea 4 = 41 +d-(k—1) un término conocido de dicha progresión. Entonces a, — az = 041 +d-(n—-1)-(a1 +d-(k-1)) = 
d(n=1-k+1) > an = a +d-(n-— k) 


e Dos términos cualesquiera a, y ag (p 4 q). Tomamos la expresión anterior para obtener d, dp — 4 =d - (p— q), y nos 
encontraríamos en el caso de conocer un término cualquiera y d. 


5.1.2 Interpolación aritmética 


El problema de la interpolación aritmética consiste en hallar un conjunto de números aritméticos entre dos números reales 
a y b. Es decir, consiste en hallar los números 2;,...,%,, de tal forma que la sucesión resultante La, 2,,..., Zn ,b) sea una 
progresión aritmética limitada. Basta con tomar a1 = 4 y Am+2 = b, ya que conocidos dos términos podemos hallar los 
restantes. 


5.1.3 Suma de un número finito de términos consecutivos en una progresión aritmética 


Para sumar términos de una progresión aritmética conviene utilizar la siguiente proposición: Sea (a, una progresión 
aritmética y p, q,r,s E Nx sip+q=T+58>=>4,+0¿ =p +40s 

Demostración: p+ q =T +8 =>p="=8S-—(Y dp — 4, =d(p—"r) =d(s— q) = 45 — q > Ap + Aq = Ar +4s 
Vamos a sumar los n primeros términos de una progresión aritmética. Denotamos dicha suma por S,,: 


Sn =041 +42 +... HAn—1 + An 


+ Sn = An + An-1 +... +42 +41 


2 - Sn = (a1 + 4) + (aa + 4n-1) +... + (an-1 + 42) + (a, +1) 


Por la proporción anterior como 14+n =2+(n-—1)=.. (n—1)+2 =m+ 1, entonces 41 + 4, = 42 + Ap-1 =... = 
(a +an).n 


An—1 + 42 = An + a1. Por tanto, 2: Sh =N: (a1 + an) > S, = HE 


5.1.4 Serie aritmética 


[cel 


»—1» Siendo (a, | una progresión aritmética. Veamos el comportamiento de 


Llamamos serie aritmética a la suma infinita >> 


dicha serie: 
S, = (a1 +0an)-n — (Q-a+d-(n—1))-n 
. 2 2 


lim S, = 00. Como S,, diverge, la serie aritmética es divergente. 
n—00 


5.2 Progresiones aritméticas de orden superior 


Se llama progresión aritmética de orden k a toda sucesión cuyo término general viene dado por un polinomio de grado k en 
n, es decir: 


aso nado AU F 00, Vn € Nx, a ER 


Notar que las progresiones ordinarias son progresiones aritméticas de primer orden. Con el fin de obtener el término general 
de un progresión aritmética de orden superior es necesario introducir el concepto de diferencias sucesivas. 
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5.2.1 Diferencias sucesivas 


A partir del algoritmo de diferencias sucesivas podemos obtener el término general de una sucesión (a, de orden superior 
k. A partir de la sucesión La, | formamos la sucesión de diferencias primeras,Ata,, = 4y.+1 — An, la sucesión de diferencias 
segundas, A?a, = Atan+1 — Alan, n € Nx, etc. Por tanto, llamamos sucesión de diferencias sucesivas de orden k, que 
denotaremos por ([A*a,,) a la sucesión: 


Ata, = APT" an pq = Aa, Vn € Nx 


Podemos disponer estas sucesiones de diferencias sucesivas de una manera práctica en forma de tabla: 


Por ejemplo tenemos: 


An. = 41 7 (as a1) | (az 42) | «+ (47, — Ap-1) 


>a,=01+Ata1+AMtas+..+Atan-—1 


y así cuando Ata” = Ata, = d, constante para todo m, es decir sus diferencias sucesivas de orden mayor a 1 serán nulas 
(Ata, = 0,Vk > 1). Se puede demostrar por inducción que si [a,,) es una progresión aritmética de orden k, entonces las 
sucesiones de diferencias finitas de orden superior a k son exactamente nulas. En este caso sería la progresión aritmética de 
orden 1 de diferencia d, en la que se cumple como sabemos a, = 01 + (n—1)-d. 

Aplicando primero a la expresión anterior A?a, = Atan+1—Atan => Atan+Atan = A*any1, tras desarrollarla obtendremos: 


=1 =-1 
amar ) a+ (> ) 


Tras lo cual se puede demostrar por inducción la siguiente fórmula, que da el término general de una progresión aritmética 
de orden k > 1, es decir, tal que A*a,, = A*a¡ = d constante para todo m. Es un polinomio de grado k en la letra n: 


=1 =-1 =-1 
ama ) + ("> ) ut. + ("7 ) 


La utilidad de las diferencias finitas está en el hecho de obtener el término general de una sucesión (a, ) a partir del 
primer término de las n sucesiones de diferencias (A*a,),k =0,...,n— 1. 

En definitiva, dada una progresión aritmética de orden superior, debemos formar las distintas sucesiones de diferencias 
finitas. Si la sucesión de diferencias de orden k +1 es exactamente nula, la progresión aritmética será de orden k. Por tanto, 
limitaríamos el sumatorio del binomio hasta el orden k, obteniendo de esta forma el término general de fa,,) 


5.3 Aplicaciones de las progresiones aritméticas 


Podemos encontrar progresiones aritméticas en nuestra cotidianidad por lo sencillas que son, veamos aquí algunos ejemplos 
de áreas más específicas: 


e Interés simple: Cuando se deposita un capital en un banco, durante un tiempo, este paga unos intereses. Si estos 
se retiran periódicamente (habitualmente un año) y los intereses solo se aplican al capital inicial, el interés se llama 
simple. El capital final C, al cabo de t años a un interés simple anual al tanto por uno r de un capital inicial C es 
C. =C;:(1+t:-") que es una progresión aritmética de diferencia r - C; 


e Planificación de Tareas y Proyectos: En la gestión de proyectos, las progresiones aritméticas ayudan a programar tareas 
con incrementos constantes en el tiempo. Esto permite asignar recursos y estimar tiempos de finalización para llevar a 
cabo proyectos de manera eficiente 


e En física, el movimiento uniformemente acelerado (MUA) es un tipo de movimiento en el que la velocidad de un objeto 
cambia de manera uniforme con el tiempo. La velocidad de un objeto en cada intervalo de tiempo forma una progresión 
aritmética. Análogamente la distancia para un movimiento rectilíneo uniforme (MRU). 


e En general cualquier función lineal puede ser interpretada como una progresión aritmética si tomamos intervalos 
constantes de x. 
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6  Progresiones geométricas 


Se llama progresión geométrica a la sucesión de números reales en las que cada término, excepto el primero, se obtiene del 
anterior multiplicándolo por una constante llamada razón: 


In+1 ="T* Gn, Vn E Nx 
Luego una progresión geométrica es una sucesión recurrente de primero orden. Resolviendo al ecuación de recurrencia se 
obtiene: gn = 91 -1”7*,Vn € Nx 
6.1 Formas de definir una progresión geométrica 


Una progresión geométrica, como toda sucesión, queda definida conociendo su término general. No obstante, debido a sus 
características, también queda definida conociendo: 


e Un término cualquiera g; y la razón r. Sea gn = g1 :7""! el término general de una progresión geométrica y sea 
¿p¿n—1 
ge = 91 rF=1 un término conocido de dicha progresión, entonces == A = pr BD) => q = gy yr 


e Dos términos cualesquiera 9, y 9, con p 4 q. Entonces a = rP1 
q 


6.2 Interpolación geométrica 


El problema de la interpolación geométrica consiste en hallar un conjunto de números geométricos entre dos números reales a 
y b. Es decir, consiste en hallar los número zx1,..., 1, de tal forma que la sucesión resultante a, 11,..., Tn, b sea una progresión 
geométrica. Basta con tomar g1 = 4 y 9n+2 = b, ya que conocidos dos términos podemos hallar los restantes 21, ..., Un 


6.3 Producto de un número finito de términos consecutivos de una progresión geométrica 


Para multiplicar términos de una progresión geométrica conviene utilizar la siguiente proposición: 


Sea [9,) una progresión geométrica y p,q,t,s € Nx, sip+q=t+s8= Yp* 9 =9t*9s- 

Demostración: p+q=t+s=>p-=t=s-—0Q, > ppt = ps9 en Ip * Ya = 9 9s 

AMOS traCIOn E 

Vamos a multiplicar los n primeros términos de una progresión geométrica. Denotamos dicho producto por P,, 


Pa = 91: 92*--* 9n-=1* 9n 


Pn = In *9n—-1*--* 92 91 


Pr =(91:9n) + (92 + 9n-1) * ===" (9n=1: 92) * (9n* 91) 
Por la proposición anterior como 1+n=2+(n-—1)=...=(n-—1)+2=nm+ 1, entonces (g1 - Jn) = (92 : 9n-1) == 
(9n—1 92) = (9n : 91). Por tanto: 
Pr = (91: 90)" >Pa= (91: 9n)” 


6.4 Suma de un número finito de términos consecutivos de una progresión geométrica 


Sumamos los n primero términos de la progresión geométrica. 
r- Sn =Y2+93 ++ (9n:1) 
Sn Y + Sn = 91 — (9n : 1) 


91 — (9: 1) L=pe 
E . 
l—-r ql l—r 
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6.5 Serie geométrica 


Llamamos serie geométrica a la suma infinita ) 3, gn, siendo [g,) una progresión geométrica. Veamos el comportamiento 
de dicha serie: 


1-r” 
Sn=91: 
eS l=r 
e Silr]<1= lim S, = > NY -1 9n = Y; > la serie converge 
n—00 


e Para el resto de valores de r la serie diverge 


La determinación de la condición de convergencia de esta serie resuelve la conocida ” Paradoja de Zenón del Estadio” que 
plantea que alcanzar la meta es imposible al dividir la distancia entre un corredor y la meta en infinitas partes. Según Zenón, 
el corredor debe alcanzar sucesivamente cada punto medio entre su posición actual y la meta, aplicando una progresión 
geométrica que divide entre dos las distancia de manera infinita y por tanto jamás podrá acabar la carrera. La paradoja 
se resuelve al comprender que, aunque hay infinitas divisiones de la distancia entre el corredor y la meta, la suma de esas 
distancias infinitamente pequeñas (al ser la razón menor que 1 como hemos dicho) converge a una distancia finita. 


6.6 Aplicaciones de las progresiones geométricas 


e Las progresiones geométricas nos permiten calcular las fracciones generatrices para los decimales periódicos tanto puros 
como mixtos, veamos un ejemplo: 


a 45 23 23 45 23 1 1 
1.4523 =1+0.4 .002 y 23+...=1 | bh... =1+4 «(14 Eos. 
; OA y 100 ñ 10000 1000000 100 E 10000 ( 100 10000 


) 


. Es decir tenemos la suma infinita de una sucesión geométrica con gí = 1 y la razón r = D0> como |r| < 1 convergerá, 


resultando: 45 23 1 14378 
1 + HD = 
100 * 10000 "'1— 1” 9900 


e Tal como planteábamos en el caso del interés simple, al depositar capital en un banco este genera unos intereses, cuando 
estos intereses no se retiran periódicamente y en el periodo siguiente el interés se aplica al capital anterior más el interés 
generado previamente, el interés se llama compuesto. El capital final C, al cabo de t años a un interés compuesto anual 
al tanto por uno r de un capital inicial C¿ es C¿ =C¿- (1+r)?, que es una progresión geométrica de razón (1 +). 


e Física: Cuando una pelota cae sobre un plano horizontal desde una altura h, la altura máxima que alcanza tras el 
n-ésimo rebote es igual a h, = c?” - h siendo c el coeficiente de restitución que depende de la elasticidad y es un número 
comprendido entre 0 y 1. 


e Pandemia: La expansión de contagio por virus corresponde a una progresión geométrica. Si hay una persona contagiada 
az = 1 y contagia a otras 3 az = 3, a su vez esas 3 contagian otras az = 9, tenemos la progresión geométrica de nuevos 
contagios [a, ) con razón r y su término general a, = 3”7*, En epidemiología, la razón se conoce como ritmo (o factor) 
reproductivo básico, RO, y representa el número medio de contagios propagados por cada persona contagiada. Este 
número tiene que ser mayor que 1 para que haya epidemia y, como parece natural, cuanto mayor es, más explosiva será 
la epidemia. Por poner unos ejemplos, el sarampión tiene un valor RO entre 12 y 18, y el ébola y la gripe común entre 
2 y 3. Con RO no somos capaces de medir cómo de letal es un virus, sólo cómo de infeccioso ha sido en una cierta 
población. Por supuesto la realidad es algo más compleja RO depende de varios factores no solo de las características 
del virus (por ejemplo decrecerá con medidas de distancia social) y también de la ventana de tiempo en las que las 
personas son contagiosas, entre otros. Pero en resumen, puede dar una idea y resultar pedagógico para explicar a la 
población el peligro y la necesidad de medidas preventivas. 


7 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachiller. Las sucesiones aparecen por primera vez en 3%eso ( y en 4%ESO como 
consolidación) dentro del sentido algebraico y pensamiento computacional, también en el sentido numérico al trabajar la 
educación financiera. Puede ser una buena idea comenzar con la suma de los 100 números naturales con la historia de Gauss 
para introducir el tema y contarles la paradoja de Zenón para las progresiones geométricas. 
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1 Introducción 


Los números complejos surgieron por el interés y la necesidad de dar solución a un problema existente: no toda función 
polinómica tiene raíz. Por ejemplo, no existe ningún número real x tal que 1? + 1= 0. Los algebristas del siglo XVI ante la 
resolución de estas ecuaciones en las que aparecían raíces de índice par de números negativos encontraron que, lógicamente, 
no tenían solución real. Es crucial la aportación de Leibnitz, quien en el siglo XVII realizó una aproximación a lo que 
posteriormente se denominó unidad imaginaria, siguiendo un razonamiento que parte de la solución de raíces cuadradas de 


números negativos: 
vV=a=vy(=D):a=v-1-ya=:i- ya 


Utilizando la simbología debida a Euler (S.XVIID), designamos por i al valor y—1 dotándolo así de un significado numérico. 
Sin embargo, esto originaba numerosas paradojas y lagunas. La construcción de una base sólida para el trabajo con números 
complejos hay que datarla en el siglo XIX con las contribuciones de Cauchy, Riemann, Wiestrass, Gauss, a quien se debe 
la denominación de números complejos y Hamilton quien plantea la introducción de los números complejos mediante pares 
ordenados entre otros grandes matemáticos. 

El número ¿ demostró su compatibilidad con las operaciones ordinarias y resultó que cualquier ecuación, fuese cual fuese 
su grado, admitía solución del tipo a+b-4¿ con a y b números reales. Los beneficios fueron inmensos, no sólo para el álgebra 
de polinomios, si no para muchos otros campos tales como la Geometría Analítica y el Análisis. Así, funciones del tipo 
F(2) = a9+a1:2+... definidas como un polinomio de infinitos términos con variable compleja (2), son muy importantes en el 
campo analítico pues permiten expresar otras funciones como e*, log(1 + z), sen(z),etc. Las funciones de variable compleja y 
su estudio, la Teoría de Funciones Analíticas, constituyen hoy en día uno de los campos más activos y con problemas aún sin 
resolver dentro de la Matemática moderna. Además son cruciales en numerosas áreas debido a su capacidad para modelar 
fenómenos físicos y sistemas dinámicos. En física, se emplean en mecánica cuántica, teoría de circuitos eléctricos y fenómenos 
ondulatorios. En ingeniería, son esenciales para el análisis de circuitos de corriente alterna, sistemas de control y diseño de 
dispositivos electrónicos. Además, se utilizan en economía y finanzas para la valoración de opciones financieras y análisis de 
series temporales, en ciencias de la computación para el procesamiento de señales digitales y gráficos por ordenador, y en 
biología y medicina para modelar sistemas dinámicos biológicos. Su versatilidad los convierte en una herramienta fundamental 
en la comprensión y estudio de diversos campos científicos y técnicos. 


2 Construcción del conjunto de los números complejos 


Como se sabe en (R,+,-) los números estrictamente negativos no tienen raíz cuadrada, entonces podemos construir un 
conjunto € que contenga a R y que mantenga su estructura algebraica donde todo elemento admita raíz cuadrada. Así 
identificaremos el conjunto R x R con C como sigue: 


C =([(a,b)la,b € Ry 


3 Números complejos en forma cartesiana 


Se define un número complejo como una pareja ordenada z = (a,b) de números reales a y b sometida a ciertas definiciones 
operacionales: 


e Igualdad: (a,b) =(c,d) Sa=cAb=d 


e Suma: (a,b) + (c,d) = (a +c,b+ d) 
e Producto: (a,b) - (c,d) = (ac— bd,ad + bc)! y m- (a,b) =(m-a,m-b),me R 


El conjunto de los pares ordenados z = (a, b) constituye el conjunto de los números complejos (C). A partir de esta definición 
podemos afirmar que el conjunto de los número complejos satisface las siguientes propiedades para la suma y el producto 
(21, 22) 23 € ¡eo 


e Interna: 2 +22€Cy21:22€C 


e Conmutativa: 21 +22=22+21 Y 21:22= 22: 21 


Asociativa: 21 + (22 + 23) = (21 +22) + 23 y 21: (22: 23) = (21 : 22): 23 
e Distributiva (del producto respecto a la suma): 21 +: (22 + 23) = 21:22 +21: 23 


e Elemento neutro: 2, +0=0+ 2, =0 siendo 0 el elemento neutro para la suma, así el complejo 0 toma la forma (0, 0). 
z1:1=1+21 = 21 siendo 1 el elemento neutro para el producto y toma la forma (1, 0). 


lse obtiene mejor desde (a + bi)(c+ di) 
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e Recíproco: Para cada z % 0 y 2 = (a,b) existe un complejo zo, tal que 2 + zo = 22 +2 =0 y zo recibe el nombre de 


recíproco respecto a la suma u opuesto de z, se denota por z. = —z = (—a,—b). 
De la manera análoga para cada 2 4% 0 y z = (a,b) existe un complejo z; tal que z+ 2¿ = 2-2 =1 y 2; recibe el nombre 
de recíproco respecto al producto o inverso de z, se denota por 2; =2"*=l= (ar 7 de: 


Analizando la propiedad podemos afirmar que (C, +) posee estructura algebraica de grupo conmutativo y si tomamos Cy = 
CA ((0,0)+ => (Co, -) también es grupo conmutativo y (C, +, -) es cuerpo conmutativo. 


3.1 Isomorfismo de ¡RR con un subconjunto de C 


El subconjunto C, de C formado por los complejos z de la forma (a, 0) es isomorfo con el conjunto RR de los números reales, 
según la aplicación: 

f:R=C, 

a => (a, 0) 


Usando la definición de suma y producto se comprueba que es una aplicación biyectiva y comprobaremos que se conservan 
las operaciones: 


e Suma: Sea f(a) = (a,0) y f(b) = (b, 0) entonces f(a) + F(b) = (a, 0) + (b,0) = (a+0b,0) = fla +b) 
e Producto: Sea f(a) = (a,0) y f(b) = (b,0) entonces fla) - Ff(b) = (a, 0) - (b,0) =(a-b,0) = f(a-b) 


Por lo tanto tiene sentido representar los complejos de la forma (a, 0) como a y comprobamos así que R está incluido en C, 
a quien puede considerarse como una ampliación de R. Tendríamos entonces que: 


NEZEQCEREC 


3.2 El espacio vectorial de los números complejos 


El conjunto de C de los números complejos sobre el que se define la suma y el producto por un número real 21 + z9 = 
(a,b) + (c,d) = (a+c,b+d) y m-2z, =m:- (a,b) =(m-.a,m-b) con meR y 21 = (a,b), z2 = (b,c) € C constituye un 
espacio vectorial de dimensión dos sobre el cuerpo de los números reales. Una base del espacio vectorial estaría formada 
por los complejos (1,0) y (0,1), en consecuencia, siempre es posible descomponer un número complejo cualquiera del modo 
siguiente: 

z= (a,b) =a- (1,0) +b-(0,1) 


4 Números complejos en forma binómica 


Consideremos la descomposición previa de un complejo z = (a,b) = a- (1,0) +b- (0,1), al número complejo (1,0) se le 
denomina unidad real y se identifica (según hemos visto) con el número real 1. Al número complejo (0, 1) se le denomina 
unidad imaginaria y se designa por ¿. Nótese que 1? = (0,1) - (0,1) = (-1,0) =—1, es decir que y-1 = . Cualquier número 
zx < 0 se puede expresar como a = (—1) - x' siendo 1 > 0 y yx = y/(=1) - 1! = ivx'. Por lo tanto, se cumple el propósito 
de los números complejos de que los números estrictamente negativos tengan raíz cuadrada. 

Partiendo desde la forma cartesiana, y tomando (1,0) y (0, 1) como referencia podemos escribir: 


z= (a,b) =a-: (1,0) +b-(0,1) =a + bi 


A esta forma de representar un complejo se le denomina forma binómica del complejo. Dado el complejo escrito en forma 
binómica z = a + bi, llamaremos parte real del complejo z, R(2), al número real a y parte imaginaria del complejo z, I(z) 
al número real b. En notación binómica las operaciones, deducidas de las presentadas anteriormente en forma cartesiana se 
plantean como: 

a +22 =(a+bi) + (c+ di) = (a+<c) +(b+ d)i 


2:22 =[(a+bi) (c+ di) =(a.c-b-d)+(a-d+b- c)i 
m-z=m>-(a+bi) =m-a+ (m- b)i 


Si dos números complejos difieren únicamente en el signo de sus partes imaginarias diremos que son conjugados entre sí, y 
dado un complejo z, representaremos su conjugado por Z. 


2=a4+bi=>2=a- bi 


Los números complejos conjugados tienen distintas propiedades, sencillas de demostrar, pero muy útiles. Así sea z = a + bi: 


2Se calcula partiendo de multiplicando por el conjugado arriba y abajo. 


a 
abi? 
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2-2 = (a+ bi) - (a— bi) = a? + b? 


e 2-2Z=(a+bi 


ez+2Z=(a+bi)+(a—bi)=2.a=2-R(z) 
) — (a— bi) = (2 - b)i=2-1I(z) 


0 211T22=2 12 
e Z21:22=21'22 


A—4A 
e£=2 con z2 40 


4.1 División de complejos 


Se define la división de número complejos como la inversa del producto de complejos. Así, dados los complejos 21 = a + bi y 
Za2 = C+ di planteamos su cociente como otro complejo z = 1 + yl, que se expresa como z = E =23 2, 1=> e = 2 +Yl, 
de donde a+ bi = (c+ di)(a + yi) = (cx — dy) + (du + cy)i. Si nos basamos en la igualdad de números complejos, nos lleva a 
escribir que cx — dy = a y dx + cy = b y resolviendo este sistema se ecuaciones se obtiene que x = a ey= a 
Desde un punto de vista práctico, calcularemos el cociente de dos complejos multiplicando el numerador y el denominador 
por el conjugado del denominador, consiguiendo el mismo resultado: 

za  a+bi  (a+bi)-(c-di)  (ac+bd) +bc— ad 


za c+di  (c+di)- (el did + d? 


con 22 40. 


5 Representación gráfica de un número complejo 


5.1 Representación puntual 


Sea R = (0, u1,u3) un sistema de referencia ortonormal del plano afín euclídeo y consideramos una aplicación del conjunto 
C en el conjunto 4? de puntos del plano afín euclídeo definido como sigue: 


f:C> A? 
z=a+bi> Pla, b) 


Al punto P del plano que tiene como coordenadas (a, b) respecto al sistema de referencia R se le denomina afijo? del número 
complejo z = a + bi. Esta aplicación es biyectiva ya que a cada número complejo se le asocia un único punto del plano y 
este, a su vez, tiene asociado un único número complejo. 


5.2 Representación vectorial 


Si a partir del conjunto de los puntos del plano 4? aplicamos g, tal que a cada punto del plano, P(a, b), su vector de posición 
P=a-u +b-u3, así obtenemos el vector de posición p asociado al complejo z = a + bi. Por lo tanto: 


Co A? y? 
z=a+bio> Pla, b) o p=a:u +b-u 


Como fácilmente puede comprobarse también g es una aplicación biyectiva. Tomando la composición de aplicaciones f o g 
vemos que asocia a cada número complejo z = a + bi un vector libre del plano que podemos ver en la Figura 1. 


Figure 1: Representación Gráfica puntual 


Cuando se emplea esta forma de representación de un número complejo el plano cartesiano recibe el nombre de Diagrama 
de Argand o plano complejo. 


Sel afijo de un número complejo es su representación como un punto en el plano complejo, donde el eje real corresponde al eje x y el eje imaginario 
corresponde al eje y. 
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5.3 Módulo de un número complejo 


Llamaremos módulo o valor absoluto del complejo z = a + bi al número real positivo ya? + b? que representaremos por |z| 
o por p que es el coincidente con el módulo del vector p' definido entre el origen de coordenadas y el afijo del complejo. 


p=|2| =|OP|= ya? + 1? 


Considerando las propiedades del módulo de un vector podemos definir las siguientes para el módulo de un número complejo, 
fácilmente comprobables: 


elli=0S>3z=0 
+ l2l=|-2 


e 12 =12 


e lz1 +29] < |21] + |2a] 


- zo] < |21| - [22] 


o 
EN 


5.4 Argumento de un número complejo 


Dado un número complejo no nulo z = a+ bi se llama argumento de z (arg(z), a.) al ángulo orientado que forma el vector ui 
con el vector OP definido entre el origen y el afijo del complejo z. Así vendría definido como: 


a. =arg(z) = arcta() 


Hay que tener en cuenta que a; no determina unívocamente el argumento de un número complejo, ya que existen infinitos 
valores de + que cumplen la igualdad. En una primera aproximación arctg(?) define dos conjuntos de ángulos en cuadrantes 
opuestos siendo los ángulos de uno de los conjuntos iguales al argumento de z pero no los del otro. Por lo tanto en la 
elección de ángulos la detección del cuadrante apropiado viene dado por los signo de a y b. A este argumento se le denomina 
argumento principal del complejo z y es el que verifica que a; € (—7,1r). Las distintas combinaciones de números complejos 
que hemos visto hasta ahora se pueden interpretar fácilmente desde el punto de vista geométrico, así el opuesto de un número 
complejo es el simétrico de ese complejo con respecto al origen, mientras que el conjugado de un número complejo el simétrico 
respecto al eje real. 


Figure 2: Representación Gráfica opuesto y conjugado 


6 Números complejos en forma trigonométrica 


Partamos de la representación gráfica de un número complejo, donde podemos apreciar su módulo (p), argumento (a) y 
las componentes a e b del complejo z = a + bi. Aplicando un sencillo razonamiento trigonométrico, podemos escribir que 
a=p-cos(a) y b=p-sen(a). De esta manera el complejo 2 se podría expresar como: 


z=a+bi=p-cos(a) + p- senla)i =p: (cos(a) + senl(a)i) 


y esta expresión recibe el nombre de forma trigonométrica del complejo z 
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7 Números complejos en forma polar 


Sea un número complejo 2 = a + bi, que tiene como módulo p = ya? + b? y como argumento a = arctg?, llamamos forma 
polar del número complejo z al par (p,«a) también representado por Pa. Si imponemos la condición de que 0 < a < 27 
obtenemos que la forma polar de un complejo es única. 


7.1 Igualdad de números complejos en forma polar 


Sean los números complejos 2, = (p,,Q041) y 22 = (p2,0%2) diremos que son iguales cuando sus módulos sean iguales y los 
argumentos difieran en 2kr radianes con k € Z 


7.2 Operaciones con números complejos en forma polar 
7.2.1 Producto 


Sean 21 = (p1, 01) y 22 = (pa, 42) dos número complejos expresados en forma polar su producto vendrá dado por: 21 + 22 = 
pi: (cosa + sena) - pa - (coso + senaai) =p, - pa: (cosa; - cosa — sena] - senos) + (sena; - cosas + senas - cosa] )i = 
p1-p2 + (cos(a] + 02) + senlay + Q9)i = (pr : p2, 41 + 02) = P1 *P2a,.0.- Por lo tanto: 


21-22 = (p1 :p2,01 +09) 


Con lo que podemos afirmar que el producto de dos números complejos en forma polar es otro número complejo cuyo módulo 
es el producto de los módulos de esos complejos y cuyo argumento es la suma de los argumentos. 


7.2.2 Cociente 


Sean 21 = (p1,01) y 22 = (pa2,02) dos número complejos expresados en forma polar su producto vendrá dado por otro 


complejo 2 = (p.a.) de modo que £ =2 + 21 = 22: 2. Basándonos en lo anteriormente expuesto tendremos que (p1, 01) = 


(pa, 2) -(p, a) = (pap, 02 +a) y debido a la igualdad de complejos en forma polar podemos obtener que p = 2 yQa=01—0Q9, 
por lo tanto: 
P1 
¿M1 — 2) = 
22 P2 P2 A1—09 


Con lo que podemos afirmar que el cociente de dos números complejos escritos en forma polar es otro complejo cuyo módulo 
es el cociente de sus módulos y cuyo argumento la diferencia de sus argumentos. 


7.2.3 Potencia 


Atendiendo a la expresión que hemos visto para el cálculo del producto de dos números complejos, 21-22 = (p1 :pa, 01 +02), si 
llevamos esto a la multiplicación de n complejos iguales obtendremos un producto de n módulos iguales, es decir, la potencia 
n-ésima del módulo. La suma de n argumentos iguales corresponde a n veces el argumento. Por lo tanto podemos afirmar 
que: 

2" = (p, a)” 5 (p",n il a) 


7.2.4 Raíz enésima 


Podemos definir la raíz n-ésima de un complejo z = (p, a) como otro complejo 2' = (p”,a”) tal que (2')” = z. Calculando la 
potencia enésima y aplicando la igualdad de complejos en forma polar podemos afirmar que: 
(p, 0) 7 (p”, ay” > (p",n ? 0!) 
p=p" =>p =x/p 
a+2kr a k 


a=n-0+2kr => 0 = =-—+27-,k€Z 
n n n 


con lo que podemos observar que el módulo queda perfectamente definido y es único, mientras que el argumento o” es múltiple, 
ya que E toma valores desde O a 2, con lo que obtenemos n argumentos distintos que verifican la condición de igualdad 
impuesta. Nótese que con k = n tenemos a +27 = a que ya no sería una raíz distinta, k > n va repitiendo las soluciones ya 
obtenidas. Esto nos lleva a afirmar que todo número complejo distinto de cero tiene n raíces n-ésimas distintas. 

Si representamos las n raíces n-ésimas de un número complejo y unimos los afijos de cada una de las raíces obtenemos un 
polígono regular con n lados inscrito en una circunferencia de radio p”, o lo que es lo mismo los 27 radianes divididos en n 
ángulos iguales (2). 
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Tustrémoslo con un ejemplo. Tomemos el número complejo 2 = ¿/(8, 5). En este caso a = 5 radianes o podríamos 


expresarlo también como «a; = 90 en grados. Obtendremos tres raíces: 


5+0 T 
=(Y8.2-3)=(9- 
21 (Y3, 3 ) 0,7) 
2 
zo =(V8, 24 e 
3 6 
+4 
2 =(/8, 2%) = (2,7) 


Observamos que la diferencia entre cada uno de los argumentos de las soluciones es zz, como habíamos dicho. 


Figure 3: Ejemplo representación gráfica raíces n-ésimas 


7.3 Fórmula de Moivre 


Si en la expresión que utilizamos para el cálculo de la potencia de un número complejo en forma polar 2” = (p, a)” = (p”,n-a) 
pasamos a la forma trigonométrica obtendremos lo que se conoce como fórmula de Moivre: (p-(cosa+senai))” = p”-cos(na)+ 
sen(na)i, cuya aplicación práctica fundamental es el cálculo del cos(na) y sen(na) en función del sena y coso. 


8 Paso de una a otra forma de expresión 


Expresión Ejemplo 
Cartesiana 2 = (a,b) (243, 2) 
Binómica 2 =a-+bi 2= 243 +2 


p- (cosa + senal) | 4: (cost + senti) 


Trigonométrica | p = Va? + b? p= y (243)? + 22 = 16 =4 
a= arctg? a= arctg5 7 =$ 


Polar 2= Pa Z= dz 


Las distintas expresiones utilizadas para representar un número complejo nos deben hacer plantearnos cuál de ellas es la más 
adecuada, desde el punto de vista didáctico, para la realización de las distintas operaciones con números complejos. 


Cartesiana | Binómica  Trigonométrica | Polar 
Suma ñ e 
Resta bi + 
Multiplicación úl di + 
División di di * 
Potencia * + 
Raíz de 
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9 Exponenciales complejas 


Se denominan exponenciales complejas a las funciones de tipo e* donde z es el número complejo de la forma a + bi, se puede 
expresar e? = e* +9 = e% . e Definimos la exponencial compleja como: 


e? =e"(cosb + sen(b)1) 


Que se obtiene de la Fórmula de Euler: 


e*! = cos(1) + sen(x)i, 1 € R 


Esto conlleva las siguientes propiedades: 
o e. e%2 — et1 +22 
ecc 40 VzEeC 
e le?| =eRe(2), Im(z) € Arg(e?) 


¿yg tz ¿2 _¿ iz 


e Ecuaciones de Euler: cosx = > y sent = 


10 Aplicaciones geométricas 


Vamos a considerar aquí expresiones complejas que pueden ser usadas para las transformaciones más sencillas en el plano: 
traslaciones, homotecias, giros y semejanzas. 


10.1 Traslaciones 
Sea a un número complejo, la aplicación t¿ : C > C tal que 
talz)=2+4 
se llama traslación definida por el complejo a. Llamamos P., al afijo del complejo z, P, al afijo del complejo a y P..+« al afijo 


de la traslación de z definida por a. Veamos como obtener P,+a: 


Imíz) 4 Pi 


9 Re(2) 


Si sumamos los vectores libres OP, y OP, , por la ley del paralelogramo, obtenemos el vector OP, y ,, definido entre el 
origen O y el afijo de 2 +a. 


Análogamente podríamos proceder para calcular la resta de complejos desde un punto de vista geómetrico, teniendo en 


cuenta que 21 — Za = 21 + (—22), con lo cual aplicaremos la ley del paralelogramo sobre 21 y sobre —z2, obteniéndose así el 
complejo diferencia. 


10.2 Giro 
Sea a = e** = cos(a) + isen(a) un número complejo con Ja] =1. La siguiente transformación se denomina giro de centro O 
y ángulo a, Ja : C >C tal que: 

gl) =23=u3 


Se llama así por su significado geométrico. LLamamos P, al afijo del complejo z, P.. al afijo del complejo z'. Veamos 
como obtener P.. a partir de P,: 
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Im(z)4 


 argla 


> 
o Re(z) 
Por un lado: |z'| = laz] = la] - [2] = 1-+|z]| = |z]. Luego P,, dista del origen lo mismo que P,. Por otro lado, 
arg[z”) = arg(az) = arg(a) + arg[z) = a+ arg(z). Así, el ángulo que forman los vectores OP. y OP, es a. Sia =r, 
entonces ga(z2) = —z, es decir se obtiene la simetría central como caso particular de un giro. 


10.3 Homotecia 

Fijado un número real no nulo r € ¡R*, denominamos homotecia de centro O y razón r a la aplicación h, : C>C: 
hrlz): 2 :="2 

Sabemos que |z'| =|rz] =|r| - |z] y que arg(2”) = arg(rz) = arg(r) + arg(z). 


e Sir >0, |2'] =rlz] y arg(z') = arg(z), entonces el ángulo entre los vectores OP,. y OP. es cero. Luego, los afijos P,, 
y P. están alineados en la misma semirrecta que pasa por O. 


Im(z)4 


> 
Re(z) 


eSir<0, [2] = |rl]z] y arg(2') = 7 + arg(z), entonces el ángulo entre los vectores OP.» y OP, es rm. Luego, los afijos 
P., y P. están alineados en la misma semirrecta, pero en distinto lado de O. 


Im(z) 


Pz 


y arglz) 


—» 
Re(z) 


Pz 


10.4 Semejanza 

Dados dos números complejos a y b, llamamos semejanza a la aplicación dada s : C —>C tal que: 
s(2)=2 :=a2+b 

Como a puede expresarse de la forma a = re'”, el paso de z a z' puede hacerse como sigue: 


2>rz+b 
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Es decir, es la composición de un giro de centro O y ángulo a, seguido de una homotecia de centro O y razón r, y por último 
una traslación definida por el complejo b. 


11 Aspectos didácticos 


En la Orden ECD/1173/2022, de 3 de agosto, por la que se aprueban el currículo y las características de la evaluación del 
Bachillerato encontramos en el sentido numérico de las Matemáticas I en la modalidad de Bachillerato científico los números 
complejos. Los números complejos se estudian como soluciones de ecuaciones polinómicas que carecen de raíces reales y a 
través de manejarlos en su forma gráfica y analítica en la elaboración de problemas se puede llegar al entendimiento de todo 
lo expuesto en este tema. 
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1 Introducción: Génesis y fundamentación de la noción de número 


La noción primitiva de número se remonta a los inicios de la humanidad y su desarrollo fue un proceso largo y lento. Muchas 
civilizaciones antiguas solo distinguían entre uno y muchos, o entre uno, dos y más de dos. Incluso algunas tribus actuales solo 
conocen dos nombres de número: uno para la unidad y otro para el par. Todo parece indicar que apareció de manera gradual 
una consciencia de una propiedad abstracta que tienen en común ciertos grupos, a lo que llamamos número. Probablemente 
la clave en ese paso está en la constatación empírica que hace el hombre a través de experiencias desordenadas, de que ciertos 
grupos de cosas pueden ponerse en correspondencia biunívoca. La consciencia de número dio paso a la necesidad de expresar 
esta propiedad mediante un lenguaje simbólico. 

Al principio se usaban los sistemas quinario y decimal debido a que se contaba con los dedos de una o las dos manos. Después 
se paso al uso de montones de guijarros para representar correspondencias biunívocas y luego a hacer muescas en un palo 
o trozo de hueso con la ayuda de un sílex. Lo más probable es que los signos para representar números precedieran a las 
palabras porque era más fácil hacer muescas que establecer una frase. Los miles de años que la humanidad necesitó para la 
abstracción de número se explica por la tendencia del lenguaje a desarrollarse de lo concreto a lo abstracto. La noción de 
número reviste dos aspectos complementarios: uno llamado cardinal que solo se basa en el principio del emparejamiento y el 
otro, ordinal, que exige el concepto de sucesión. En realidad todo elemento de la serie regular de los números naturales se 
obtiene añadiendo una unidad al anterior. La base de los progresos en la consolidación del concepto de número es la facilidad 
de identifica lo aspectos cardinal y ordinal. 

Mientras que en la práctica el número cardinal es el que nos interesa, éste es incapaz de servir de base a una aritmética, pues 
las operaciones están fundadas en la hipótesis de que siempre podemos pasar de un número cualquiera a su sucesor. Ahora 
bien, en esto consiste la esencia del concepto de número ordinal. Sin nuestra facilidad para disponer los objetos según la 
sucesión natural se habría progresado muy poco. Nuestro sistema numérico esta impregnado de estos dos principios, el de la 
correspondencia y el de la sucesión, que constituyen el tejido de todas las matemáticas. 

La construcción formal de los número naturales puede hacerse por dos vías. Como concepto primitivo, el número natural 
puede introducirse axiomáticamente, camino seguido por Peano y Hilbert. Como alternativa, como concepto derivado de la 
teoría de clases, se basa en la idea de conjuntos coordinables, camino iniciado por Cantor y Frege y perfeccionado por Russell. 
La definición de cardinal, tal como se conoce hoy, se debe al lógico y matemático alemán F.L.G Frege (S. XIX). Intento dar 
una noción de cardinal más rigurosa, apoyándose en la idea de correspondencia biunívoca entre dos conjuntos. Pero la teoría 
de conjuntos trajo el hallazgo de "conjuntos paradójicos” que condujo a cuestionar la existencia del ”conjunto de todos los 
conjuntos”. 

Partiendo de un objetivo similar al de Frege, Giussppe Peano (S.XIX) intentó desarrollar un lenguaje formalizado que 
permitiera fundamentar la aritmética. Su nombre ha quedado asociado a los axiomas de Peano, sobre los que se han apoyado 
tantas construcciones rigurosas del álgebra y del análisis. Eligió tres conceptos primitivos: cero, número, y la relación binaria 
”es sucesor de” y estableció sus cinco postulados. 

No obstante fue Hilbert el verdadero sistemizador del pensamiento axiomático, aunque los primeros pasos se deben a 
Grassmann y Dedekind. Aunque el método axiomático fue universalmente aceptado se abría una crisis de los fundamentos 
que conmovería el mundo matemático entre al principio del siglo XX. 

Hay que señalar que el desarrollo completo de ambos procedimientos, el axiomático de Peano y el conjuntista de Russell, 
no fueron en su día totalmente satisfactorios. Por un lado el sistema de Peano es axiomático y ordinal en su iniciación y 
posteriormente intenta desarrollar la teoría cardinal. Mientras por otro lado Russell desarrolla la aritmética cardinal como 
un capítulo de la teoría de clases y posteriormente introduce el número ordinal. En ambos la justificación lógica del aspecto 
postergado aparece a la intuición como inútilmente complicada, al demostrar teoremas cuya sola enunciación ”evidente” 
asombra al principiante. 


2 Concepto de número 


2.1 El concepto de número natural 


El concepto de número aparece ligado al de número natural, pero tomando con reservas el calificativo de «natural». El 
concepto de número aparece como un producto social de construcciones personales necesarias para el desarrollo del ser 
humano en el medio, en el que intervienen factores comlejos como la simbolización, asignación, y el lenguaje y que evoluciona 
profundizando y extendiéndose en la medida que tiene que dar respuesta a las necesidades. Con las consideraciones expuestas 
en la introducción a propósito de los aspectos ordinales y cardinales del número, las aportaciones de Peano y Hilbert plantean 
una vía axiomática para la construcción del mismo. La axiomática de Peano permite definir los naturales N como un conjunto 
en el que se contemplan los siguientes axiomas: 


e Axioma 1: Cero es un número natural (0 € N). 
(Nota: En la formulación original Peano estableció el uno y no el cero como primer número natural. Este axioma 
implica que N es no vacío ya que contiene al cero ) 


e Axioma 2: A cada número natural n € N, le corresponde otro número natural al que llamamos sucesor o siguiente de 
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n y al que denotaremos por n*,sg(n) ó d(n). SineN=>n* eN. 
(Nota: Este axioma da el procedimiento general de la construcción de los números naturales, N = (0, 1, 2,3, 4...), siendo 
o(0) =1,0(1) = 2,0(2) = 3,etc;) 

e Axioma 3: Cero no es el siguiente de ningún número natural. 


(Nota: Este axioma impide que se vuelva al 0) 


e Axioma 4: A dos números naturales distintos corresponden siguientes distintos, o lo que es lo mismo, los siguientes de 
dos números son iguales si y solo si ambos números son iguales. Sin,mEN:n? =m* Sn=m. 
(Nota: Este axioma garantiza que la cadena de ”siguientes” es infinita. Diremos que el conjunto de los números 
naturales están engendrados a partir del cero obteniendo el siguiente de cero (uno), el siguiente del siguiente de cero 
(dos), etc) 


e Axioma 5: Si un conjunto de números naturales U contiene al cero y también al sucesor de cualquier número que 
pertenezca a U, entonces todo número pertenece a U. Si U CN cumple (0ENANEU=>n*EU)=>U=N 
(Nota: Este axioma concebir los naturales en su forma final, se conoce como axioma de recurrencia) 


Además de la propuesta por Peano y Hilbert existe otra vía alternativa para la construcción de los números naturales. Esta 
alternativa proviene del concepto derivado de la teoría de clases y se basa en la idea de conjuntos coordinables, camino 
iniciado por Cantor y Frege y perfeccionado por Russell. 


2.2 Leyes de composición de los números naturales 
2.2.1 Suma 


Definición: A todo par (x, y) de número naturales asociamos otro número natural, llamado suma de x e y que denotamos por 
x +y, definiéndolo por recurrencia como sigue: 


l. 1+0=x 
2. Suponiendo definido x + y, definimos x + y* como 2 +y* = (2 +y)* 


La notación de siguiente de n aplicando la suma sería c(n) = 1+mn ya que 0(0) =1+0=1,0(1) =1+0(0) =1+1+0=2, 
etc; Tenemos las siguientes propiedades: 


1. La suma está bien definida: Vn,mEeN:n+meEN. 
2. Asociatividad: Para cualesquiera m,n,p € Nes (m+mnm) +p=m+ (n + p). 
. Elemento neutro: Existe un elemento de N, que es el cero, verificando: n+40=0+mn=mnm,Vn eN. 


3 

4. Conmutatividad: Para cualesquiera m,n € N se cumple m+n=n+m. 

5. Ningún número natural salvo el cero tiene simétrico, m4+n=0=>m=mn=0. 
6 


. Ley cancelativa o simplificativa: m+p=n+p=>m=m. 


2.2.2 Producto 


Definición: A todo par (x,y) de números naturales asociamos otro número natural llamado producto de x e y, que denotamos 
por (x - y), definiéndolo de forma recurrente como sigue: 


e x-0=0 (El cero es elemento absorbente por la derecha) 


e Suponiendo definido x - y, definimos x - y? como 2-y?*=x-Yy+z 
Propiedades: 
1. El producto está bien definido: V(n,mEN:n-mEN 


Distributiva respecto a la suma: Para cualesquiera m, n, p € N se cumplen m-(n+p) = m"n+m-p y (m+n)-p = m-p+n-p. 
Asociatividad: ”Para cualesquiera m, n,p € N se cumple (m-n) - p =m: (n - p). 
Conmutatividad: Para cualesquiera m,n € N se cumple m-n=n-m. . 


Elemento neutro: Existe un elemento de N, que es el uno, verificando n-1=1-.n=n,Vn € N. 


En los números naturales no hay "divisores de cero”: n.-.mMm=0=>n=0Vm=0. 


OA O AI 


Ley cancelativa o simplificativa: Si n.-m =n-+p => m= p,Vn € N*. Todo número natural, salvo el cero, es regular para 
la multiplicación. 


8. Ningún número natural, salvo el uno, tiene simétrico: m:-n=1=>m=n=l. 
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3 Ampliaciones del concepto de número 


El ser humano ha ido ampliando su campo numérico a medida que ha necesitado resolver situaciones problemáticas, pero 
hay que tener en cuenta que un mayor refinamiento coincidente con la ampliación del campo numérico ha producido que las 
ampliaciones no se extiendan al total de la población, lo que no pasaba con los números naturales, de modo que éstas han 
sido patrimonio de ilustrados lo que ha contribuido a destacar el carácter mágico conferido a las Matemáticas. 

En esta sección vamos a explorar las sucesivas ampliaciones del concepto de número así como su evolución histórica y los 
problemas que resuelve cada una. 


3.1 Los número enteros 


Aunque en la epistemología formal de las Matemáticas se requiere la introducción de los enteros, la resolución de situaciones 
problemáticas de la vida real propicia la introducción de los racionales. No obstante en la presentación de las sucesivas 
ampliaciones se atenderá a la construcción formal. 

Los números negativos aparecieron tardíamente si se les compara con los irracionales. Surgieron por primera vez en la 
India, cerca del siglo VII, durante el período clásico hindú. Fue Brahmagupta quien desarrolló formalmente una teoría de los 
números negativos y su uso en cálculos aritméticos y algebraicos. Inicialmente, los matemáticos indios utilizaban palabras 
para referirse a números negativos, como «deudor> o «deuda>. No fue hasta el siglo XV que los alemanes comenzaron 
a utilizar símbolos como -3 para representar números negativos, mientras que en Italia se usaban los prefijos p y m. La 
evolución de los números negativos ha sido interesante, ya que inicialmente se consideraban abstracciones matemáticas sin 
sentido físico. Por ejemplo, Stifel en el siglo XVI realizó una de las aportaciones más valiosas en su obra al tratamiento de 
los números negativos pero se negaba a considerarlos raíces de una ecuación, llamándolos numeri absurdi. Fue en este siglo 
cuando se asentó la aceptación casi definitiva contribuyendo a ello de modo especial una gran figura del momento: Francois 
Viéte. 

Desde un punto de vista estrictamente matemático, los número enteros Z surgen ante la necesitad de resolver la ecuación 
del tipo + a =b,Va,b € N, el campo de trabajo en este contexto son los números enteros, siendo claro en aquellos casos en 
que a > b, y considerando la situación natural como un caso particular en el que a < b. Para una construcción formal de los 
números enteros hemos de recurrir al establecimiento de una relación de equivalencia (reflexiva, simétrica y transitiva) sobre 
N x N donde se utiliza como operación la suma de números naturales, que constituye una partición de Nx N: 


(a,b)R(c,d) Sa+d=b+c 


Cada uno de los subconjuntos de N x N formados por todos los pares de números naturales equivalentes entre sí constituyen 
las clases de equivalencia [(a, b)] y cada uno de los elementos de la clase es un representante de dicha clase. 


[(a, b)] =((m,n) € N x N|(m,n)R(a, b)j 


Se llama número entero a cada una de estas clases de equivalencia. El conjunto cociente N x N/R formado por todas las 
clases de equivalencia se denomina conjunto de los números enteros Z. Dado (a,b) € N x N Se pueden dar tres casos: 


e a <b: En este caso existe m € N tal que a =b+ mm. Entonces se verifica (a, b)R(m, 0).Todos los elementos de |(m, 0)] 
son de la forma [(m, 0)] = [(b + m,b)/b € N) y siendo su representante canónico (m, 0). Al representante de [(m, 0)] lo 
denotaremos con el símbolo +m, o simplemente,m. El conjunto Z+* = [[(m,0)]/m € Nj lo llamaremos conjunto de los 
números enteros positivos. 


e a > b: En este caso existe n E N tal que a+mn= b. Entonces se verifica (a, b)R(0,n).Todos los elementos de [(0, n)] 
son de la forma [(0,n)] = ([(a, a +n)/a € Nj y siendo su representante canónico (0,n). Al representante de [(0,n)] lo 
denotaremos con el símbolo —n. El conjunto Z” = ([(0,n)]/n € Nj lo llamaremos conjunto de los números enteros 
negativos. 


e a. = lb: Se verifica que (a,b)R(0,0). Todos los elementos de [(0,0)] son de la forma [(0,0)] =((a, a)/a € N)? y siendo su 
representante canónico (0,0). Al representante canónico de [(0,0)] lo denotaremos con el símbolo 0. 


Ahora ya estamos en condiciones de afirmar que Z = Z+*U([0OUZ”. Dos elementos son del mismo signo si ambos pertenecen 
a Z* 0 a Z7 y son de signo distinto si uno pertenece a Z* y el otro a Z7, o viceversa. 
Podemos entender por número enteros el menor anillo que contiene al conjunto de los números naturales. 


3.2 Los números racionales 


El ser humano hizo uso de los números racionales antes que de los números enteros. Este hecho se debe a la necesidad de 
representar partes fraccionarias de unidades al resolver problemas de la vida real relacionados con la medida. La aplicación 
práctica de los números racionales se remonta a épocas antiguas, aunque su formalización y estudio matemático fueron 
desarrollados en etapas posteriores. 
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Aunque se supone que su uso fue anterior, fue en la Edad de Bronce donde se observan los primeros vestigios del uso de 
fracciones. Este período histórico puede considerarse como pionero en la manipulación de fracciones, ya que era necesario 
para diversas actividades cotidianas, como el comercio, la construcción y la mediciones de terrenos. 

Las primeras referencias escritas sobre fracciones se encuentran en los Papiros del Rhin (1550 a.C.), donde se emplea una 
notación para representar fracciones del tipo Z. Además, en Mesopotamia también se utilizaron las fracciones, aprovechando 
su sistema de numeración posicional, lo que permitió un cálculo eficiente y un registro detallado de acuerdos comerciales y 
medidas. 

Sin embargo, a pesar de su uso extendido en otras culturas, llama la atención la falta de consideración de las fracciones por 
parte de los griegos antiguos en su desarrollo matemático. Aunque los griegos eran conscientes de las relaciones numéricas 
que podrían expresarse como fracciones, como lo evidencian algunas demostraciones geométricas de la época, su enfoque 
principal estaba en los números enteros y en la geometría pura. 

A partir de finales del siglo XV y comienzos del siglo XVI, se adoptó la forma moderna de representación de las fracciones, 
expresando cada cantidad por un número m de unidades que contiene y el número n de unidades que contiene la unidad 
fundamental. Esta representación se realiza bien mediante el par (m,n) o mediante la notación 4%, donde m se denomina 
numerador y n denominador. Este sistema de representación proporcionó una manera más clara y uniforme de trabajar con 
fracciones, estableciendo las bases para su estudio sistemático en la matemática moderna. El conjunto de los pares (m, n) con 
m y n enteros constituye el conjunto de los números racionales Q exceptuando que n debe ser distinto de O. Los racionales 
surgen a fin de poder resolver la ecuación del tipo a. =b con a,b€ Z,a 40 y el conjunto de soluciones de esta ecuación 
amplía el conjunto de los números enteros. 

Si en Z x Z definimos las siguiente relación binaria de equivalencia (a,b)R(c,d) > a -d = bc, el conjunto cociente 
Q =Z xZy/R constituye el conjunto de los números racionales y cada una de las clasesd e equivalencia constituye un número 
racional. a 

Q= (glo, beZAbA0) 


Q es una extensión de Z, ya que los elementos de este conjunto aparecen en aquellos casos en que a sea múltiplo de b. Q el 
menor cuerpo que contiene al conjunto de los números naturales. 


3.3 Los números reales 


Desde el s. VI a.c los griegos habían descubierto que la medida de la diagonal de un cuadrado era ”inconmensurable” 
entendiendo esto como que no existía relación con la medida del cuadrado en el que se dibujaba. Trabajando en base a 
construcciones geométricas para establecer la razón entre dos segmentos rectilíneos y aplicando el teorema de Pitágoras, 
este intuyó que debía existir un número diagonal tal que trabajando sobre un cuadrado de lado uno, se verificase que 
d? = 1? 4 1? = 2, pero se encontró con la dificultad de no poder utilizar un número racional como expresión de d ya que: 
d? o 2 SS a? =2-b?. Lo que estaba en contra del planteamiento inicial, con lo que llegó a que no existía 
ningún número racional cuyo cuadrado fuera 2, y al no entrar estos planteamientos dentro de lo conocido hasta el momento 
denominó a estos números «inexpresables>. 

Posteriormente, en el s.V, los matemáticos hindúes consideraron como números irracionales de números, planteándose 
tímidamente la diferencia entre los números mensurables e inconmensurables. 

Caracteriza a los números irracionales el no ser solución de ninguna ecuación de primer grado con coeficientes enteros, a lo 
que en el s. XIX Abel y Galois dieron la vuelta ampliando el conjunto numérico al de los números irracionales, definiéndolos 
como solución de una ecuación algebraica con coeficientes enteros, lo que constituyó un marco de trabajo que se vio modificado 
por las aportaciones de Hermite y Liouville que enunciaron la existencia de los números trascendentes como aquellos que no 
son soluciones de ninguna ecuación algebraica con coeficientes enteros o fraccionarios. 

Entre las construcciones más interesantes de los números reales destacan la de Cantor en base a las sucesiones de Cauchy 
en los números racionales y la de Dedekind en base a cortaduras en el conjunto de los números racionales. 

Las cortaduras de Dedekind se definen como subconjuntos de Q, con ciertas propiedades especiales de manera que cada 
una de ellas define un número real, debido a su extensión no las desarrollaremos. 

El método de las sucesiones de Cauchy atiende a que Q no es sucesionalmente completo se define cada número real como 
una clase de sucesiones de Cauchy, de modo que dos son equivalentes cuando la diferencia de ambas converge a O. El conjunto 
R así construido es un cuerpo ordenado y completo. 

Definimos los números reales como las sucesiones de números racionales que son de Cauchy. Más exactamente por clases 
de equivalencia de sucesiones de Cauchy. Las que no son convergentes en Q darán lugar a los que denominaremos números 
irracionales. 


3.4 Los números complejos 


Los algebristas del siglo XVI ante la resolución de ecuaciones en las que aparecían raíces de índice par de números negativos 
encontraron que, lógicamente, no tenían solución real. Es crucial la aportación de Leibnitz, quien en el siglo XVII realizó una 
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aproximación a lo que posteriormente se denominó unidad imaginaria, siguiendo un razonamiento que parte de la solución 
de raíces cuadradas de números negativos: 


Va=y(ED-a=vVA1-Va=i-ya 


Utilizando la simbología debida a Euler , designamos por i al valor y=1 dotándolo así de un significado numérico. Sin 
embargo, esto originaba numerosas paradojas y lagunas. La construcción de una base sólida para el trabajo con números 
complejos hay que datarla en el siglo XIX con las contribuciones de Cauchy, Riemann, Wiestrass, Gauss, a quien se debe 
la denominación de números complejos y Hamilton quien plantea la introducción de los números complejos mediante pares 
ordenados entre otros grandes matemáticos. 

Se define un número complejo como una pareja ordenada z = (a,b) de números reales a y b sometida a ciertas definiciones 
operacionales: 


e Igualdad: (a,b) =(c,d) Sa=cAb=d 


e Suma: (a,b) + (c,d) = (a +c,b+ d) 
e Producto: (a,b) - (c,d) = (ac— bd, ad +bc) y m- (a,b) = (m-a,m-b)meR 


El conjunto de los pares ordenados z = (a, b) constituye el conjunto de los números complejos (C). A partir de esta definición 
podemos afirmar que el conjunto de los número complejos satisface las siguientes propiedades para la suma y el producto 
(21, %, 23 € C): 


e Cerradura: 21 +22€Cyz21:22€C 


e Conmutativa: 21 + 22=22 +21 Y 21:22=292: 21 


e Asociativa: 21 + (22 + 23) = (21 + 22) + 23 y 21 : (22: 23) = (21 : 22) : 23 
e Distributiva (del producto respecto a la suma): 21 +: (22 +23) = 21:22 +21: 23 


e Elemento neutro: 21 +0=0+ 21 =0 siendo 0 el elemento neutro para la suma, así el complejo 0 toma la forma (0, 0). 
z1:+1=1+21 = 21 siendo 1 el elemento neutro para el producto y toma la forma (1, 0). 


e Recíproco: Para cada z 4 0 y 2 = (a,b) existe un complejo zo tal que 2 + zo = 22 +2 =0 y zo recibe el nombre de 


recíproco respecto a la suma u opuesto de z, se denota por z. = —z = (—a,—b). 
De la manera análoga para cada 2 4 0 y z = (a,b) existe un complejo z; tal que z + z¿ = 2-2 =1 y 2; recibe el nombre 
de recíproco respecto al producto o inverso de z, se denota por 2, =27!= z = (aaa 7 ). 


Analizando la propiedad podemos afirmar que (C, +) posee estructura algebraica de grupo conmutativo y si tomamos Cy = 
CA ((0,0)+ > (Co, -) también es grupo conmutativo y (C, +, -) es cuerpo conmutativo. 
El subconjunto C, de C formado por los complejos z de la forma (a, 0) es isomorfo con el conjunto R de los números 
reales, según la aplicación: 
f:R>C, 


a => (a, 0) 


Usando la definición de suma y producto se comprueba que es una aplicación biyectiva y comprobaremos que se conservan 
las operaciones: 


e Suma: Sea f(a) = (a,0) y f(b) = (b,0) entonces f(a) + F(b) = (a, 0) + (b,0) = (a+0b,0) = fla +b) 
e Producto: Sea f(a) = (a,0) y f(b) = (b, 0) entonces f(a) - F(b) = (a, 0) - (b,0) =(a-b,0) = f(a-b) 


Por lo tanto tiene sentido representar los complejos de la forma (a, 0) como a y comprobamos así que R está incluido en C, 
a quien puede considerarse como una ampliación de R. Tendríamos entonces que: 
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4 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Dentro de los saberes básicos es el sentido numérico 
donde se da uso práctico a lo presentado en este tema pero es en el sentido socioafectivo donde se propone que la materia 
debe valorar la contribución de las matemáticas y el papel de matemáticos y matemáticas a lo largo de la historia en el 
avance de la ciencia y la tecnología. Por lo tanto este tema debe desarrollarse de manera transversal en toda la educación 
secundaria, adecuado al nivel de cada curso, tal como se vayan presentando los diferentes conjuntos de números, especialmente 
su desarrollo histórico. 
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1 Introducción 


Una de las nociones más fundamentales, y a la vez más intuitiva, de la Matemática es la de conjunto, la cual fue desarrollado 
como teoría autónoma por G.Cantor a finales del siglo XIX, construyendo una teoría completa desde sus fundamentos hasta 
sus conclusiones, la cual posee una estructura de la que gran parte se conserva actualmente. Cantor nos ofreció la siguiente 
definición: “Un conjunto es una colección en un todo de determinados y distintos objetos de nuestra percepción o nuestro 
pensamiento, llamados los elementos del conjunto”. La relación más simple entre conjuntos es la igualdad (A = B), son 
iguales si tienen los mismos elementos (axioma de unicidad). Es decir que todo elemento del primer conjunto lo es del segundo 
y viceversa. 
A=B>5(VWreE A>reBAWeB>y€A4) 


Lo que nos lleva a la necesidad de definir un conjunto; para lo cual hay que precisar cuales son todos y cada uno de los 
elementos que lo forman. Esto se puede hacer por extensión (nombrando cada uno de los elementos) o por comprensión 
(definiendo la propiedad que caracteriza a los elementos del conjunto). La noción de conjunto como objeto matemático 
queda limitada por axiomas que permiten construir conjuntos a partir de otros, estos axiomas permiten abordar algunas 
contradicciones. Por ejemplo, la paradoja de Russell muestra que la teoría de conjuntos puede ser inconsistente. Considera el 
conjunto de todos los conjuntos que no se contienen a sí mismos. Si este conjunto se contiene a sí mismo, entonces no debería 
hacerlo, y si no se contiene a sí mismo, entonces debería hacerlo. Esta contradicción demuestra que la teoría de conjuntos 
debe acotarse con axiomas para evitar tales paradojas 


1.1 Subconjuntos de un conjunto 


Dado un conjunto A, llamaremos subconjunto de A a todo conjunto cuyos elementos lo sean también de A. 
BCASVIreB>IEA 


Según esta declaración todo conjunto es un subconjunto de sí mismo, para evitarlo se introduce el concepto de subconjunto 
propio: B es un subconjunto propio de A si existe al menos un elemento de A que no lo es de B. Dados dos subconjuntos B 
y C de un conjunto A, constituyen partes disjuntas si no existen elementos en común entre B y C. Dado un conjunto A, si 
consideramos todos sus posibles subconjuntos, estamos ante lo que se denomina conjunto de las partes de A o potencia de 
A (P(A)). Llamamos conjunto universal o referencial (U) al conjunto formado por todos los conjuntos con los que estamos 
trabajando. Llamaremos conjunto vacío (0) a un conjunto carente de elementos. 


2 Álgebra de Boole de las partes de un conjunto 


Habiendo definido las partes de A, veamos ahora cuáles son las operaciones que podemos establecer entre ellas. 


e Unión: (de B y C), constituye un conjunto cuyos elementos pertenecen a B, a C o a ambos. 
BL]C=(rj1€EBVxEC) 
e Intersección: (de B y C'), constituye un conjunto cuyos elementos pertenecen simultáneamente a B y a C. 


B(]C=(rjxEeBAZEC) 


La unión e intersección de conjuntos satisfacen las siguientes propiedades: VWB,C,D € P(A) 


Propiedad Unión Intersección 
Idempotencia BUB=B BNB=B 
Conmutativa BUC=CUB BNC=CNB 
Asociativa BU(CUD)=(BUCIUD Bn(CnaD)=(BAC)IND 
Simplificativa BU(BNC)=B Bn(BUC)=B 
Elemento neutro BUb=B BnNA=B 

Elemento universal BUA=A - 

Elemento absorbente - Bn0=0 
Distributivas (BUCO)IAD=(BADU(CNAD) (BNC)IUD=(BUDIN(CUD) 


Son fácilmente demostrables basándonos en las propiedades de la lógica de conjuntos. A modo de ejemplo se demuestra una 
de las propiedades distributivas: 
(BUCOND=(BNDU(CND) 


Demostración de izquierda a derecha: 
e(BUCOIND|]>xEe(BUCIAIED 
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e(BUC)=>rEBVIEC 

Sabemos que € D,sireB=>xEe(BND)>xe(BND)U(CND) 
Sabemos que € D,SireC=>xEe(CNAD)>xEe(BNAD)U(CAD) 
Demostración de derecha a izquierda: 
e(BnDU(CNAD)>e(BND)VxEe(CND) 
Sire(BAD)>rreBAIED>E(BUCIND] 
Sire(CND)>rECALED>E(BUCIND] 


e Diferencia: (entre B y C') es el conjunto de elementos de B que no pertenecen a C 


B-C=(30dxreBAECi 


e Complementario: Si B es un subconjunto de A, el complementario de B con respecto a Á es el conjunto diferencia 
A—B. 
B=4ixE€AMTIEB) 


Como casos particulares se tiene que A = () y NV = A. Asociando cada B € P(A) su complementario B € P(A) queda 
establecida la correspondencia de complementos entre las partes de A, con las siguientes propiedades: 


— Involutiva: (5) =B 
— Monotonía: BCCSCOCCB 
B=A 


— Complementaria: BU 


AUB 


Las partes de A con unión e intersección son retículos distributivos y complementarios, y estos se denominan Álgebra de 
Boole.' 
2.1 Leyes de Morgan 


Las leyes de Morgan constituyen las propiedades más importantes de la correspondencia de complementos entre las partes 
de un conjunto: 


(BUO) =BnC 
(BNC)=BUC 


Y a partir de ellas aplicando la propiedad involutiva (doble negación): 


(BUC)=BNC 
(BNC)=BUC 


Son demostraciones sencillas así que como ejemplo demostraremos la primera: 

De derecha a izquierda: 
Sire(BUC)>xé¿(BUC)=>xé¿BaréC>reBATEC>=>zxc(BNC) 
De derecha a izquierda: 
Sire(BnNC)>xeBATEC>IEBAIEC=>1IEÉE(BUC)>zxE(BUC) 


1 


un retículo es una estructura algebraica que consiste en un conjunto parcialmente ordenado en el que cada par de elementos tiene un supremo 
y un ínfimo. Un ejemplo de retículo es el conjunto de los subconjuntos de un conjunto dado, donde la relación de orden es la inclusión de conjuntos 
(si están unos incluidos en otros). En este caso, el supremo de dos subconjuntos sería su unión, y el ínfimo sería su intersección. 
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3 Producto de conjuntos 


3.1 Pares ordenados 


Son los elementos más simples a partir de los cuales se definen las relaciones, se originan cuando en un conjunto de dos 
elementos se introduce un principio de asimetría. A partir del concepto de par ordenado llegamos al producto cartesiano y 
por generalización a la definición de las n-uplas como conjuntos ordenados de n elementos y a los productos cartesianos de n 
conjuntos. Definimos un par ordenado (x,y) como un conjunto formado por dos elementos, en la que se distingue un primer 
elemento (1) y un segundo elemento (y). Su notación es entre paréntesis siendo su ordenación en el mismo la relación de 
orden. Así, dos pares ordenados (zx, y) y (u, v) serán iguales si y solo si x=ue y =0. 


3.2 Producto cartesiano 


Definimos producto cartesisano de dos conjuntos A y B (Ax B) al conjunto cuyos elementos son todos los pares ordenados 
(x,y) con € A y y€ B. De la definición se deducen las siguientes consecuencias: 


1. SIAXxB=0=>A=(VB=0 
2. SI AXxBANVAICxDCAxB=>CCAADCB 


3. Se cumple la propiedad distributiva con respecto a la unión, la intersección y la diferencia manteniendo la relación de 
orden. Por ejemplo: (AUB)xC=(AxCIU(BxC) 


4. (Ax B)N(CxD)=(ANC)Ix(BND) 
5. AxB=BxAsSA=B 


La definición se generaliza a terna ordenada siendo la terna (x,y,z) igual al par ordenado con primer elemento (x,y) y 
segundo z. Por deducción esta definición se amplia a la n-upla. Así dados n conjuntos A1,..., A, un n-upla es un par 
ordenado cuyo primer elemento es la (n-1)-upla y el segundo x,, dónde 1, € Aj, 12 € Az,..., Zn € An. Si los A¿ conjuntos son 
iguales podemos recurrir a la notación potencial 4”, con lo que R? será el plano cartesiano y R” el espacio de dimensión n. 


4 Grafos y relaciones 


4.1 Grafos 


Definimos Grafo como un conjunto cualquiera (G) de pares ordenados (x, y). Dado un grafo G, existe un único conjunto A 
cuyos elementos son los primeros elementos (1) que se denomina primera proyección y otro único conjunto B constituido por 
los segundos elementos (y) y al que se denomina segunda proyección. 


A= [x|2y, (x, y) = Gjy, B > (yl3x, (2, y) € G) 


Por lo tanto G € Ax B (producto cartesiano). 

Se designa por G7* al conjunto de todos los pares (y,x) tal que (1,y) € G. La primera proyección de G es la segunda 
proyección de G7! y viceversa. Se designa G, o Ga al grafo compuesto que es el conjunto de todos los pares ordenados (x, z) 
formados por el primer elemento de un par (x,y) € G1 y el segundo de otro par (y, ) € G2 cuando el segundo elemento del 
primer par y el primer elemento del segundo par coincide. 


G10Ga2=((x, 2) dy, (2,y) € G1 A (y, 2) € Ga) 


Se puede deducir la propiedad asociativa de la composición de grafos. Dados tres grafos G1,G2,G3 => G1 o (Ga o Gz) = 
(G1 0 G2) 0 G3 


4.2 Relaciones 


Una relación R entre dos conjuntos A y B es un conjunto formado por tres elementos R = (G, A, B) donde G es un grafo de 
la relación, en el que su primera proyección está incluida en A (dominio de la relación) y su segunda proyección está incluida 
en B (recorrido) y R es la relación de A a B. Así, si (x,y) € G => z está relacionado con y en R, (2Ry). 

Podemos entender una relación entre A y B como un subconjunto del producto cartesiano A x B. 

R71= (G7!, B, Aj es la relación inversa de R. El dominio y recorrido de R”* coincide con el recorrido y el dominio de R, 
respectivamente. 

R¡ o Ra es la relación compuesta (G1 o Ga, A, Cj donde Ri =4G1, A, B) y Ra = (Ga, B,CY La propiedad asociativa de las 
relaciones Ry o (R2 o R3) = (R¡ o R2) o Rz se cumple si son tres relaciones que satisfacen que el conjunto de llegada de cada 
una coincide con el conjunto de salida de la siguiente. 
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4.3 Relaciones binarias 


Cuando en una relación su dominio y recorrido coinciden, R C 4?, hablamos de una relación binaria en la cual se define un 
conjunto de dos elementos R = [G, 4). Si G = 4? hablamos de relación total mientras que si G = (f estaremos ante una 
relación vacía. Prestemos atención a los siguientes tipo de relaciones binarias siendo R =(G, Aj: 


e Relación reflexiva: Vx € A> (1,1) € G 

e Relación simétrica: W(x,y) € G= (y,1) € G 

e Relación asimétrica: W(x,y) € G=> (y,1) ¿G 

e Relación antisimétrica: Si (1,y) € GA H y > (y, 1) € G. Antisimétrica es la asimétrica pero que incluye la reflexivaVz 


e Relación transitiva: Si (1,y) € GA(y,2)€G=> (1,2) €G 


4.4 Relaciones de equivalencia 


La relación R definida en un conjunto A % ( es de equivalencia si es reflexiva, simétrica y transitiva. Una relación de 
equivalencia en A determina una partición cuyas partes son las clases de equivalencia y recíprocamente toda partición de 
A da lugar a una relación de equivalencia. El conjunto de las clases de equivalencia se denomina conjunto cociente (A/R) 
de A con respecto a la relación R. Por ejemplo, consideremos el conjunto A de todos los números enteros y la relación de 
equivalencia R ”tener el mismo resto al dividir por 5”. Bajo esta relación, todos los números enteros que tienen el mismo 
resto al dividir por 5 están en la misma clase de equivalencia. Entonces, la clase de equivalencia de 0 incluiría a todos los 
números enteros que son múltiplos de 5 (como 0, 5, -5, 10, etc.), la clase de equivalencia de 1 incluiría a todos los números 
enteros que tienen un resto de 1 al dividir por 5 (como 1, 6, -4, 11, etc.), y así sucesivamente. 


4.5 Relaciones de orden 


La relación R definida en un conjunto A H () es de orden si es reflexiva, antisimétrica y transitiva. Además es de orden estricto 
si es transitiva y asimétrica. Dados dos elementos zx, y € A puede presentarse solo una de las dos situaciones siguientes 


1. Al menos uno de los dos pares (x, y), (y, 1) € R y por lo tanto x, y € A son comparables 


2. Ninguno de los pares anteriores pertenece a R 


Diremos que A está totalmente ordenado si y solo si todos sus elementos se relacionan entre sí, es decir que si cualquier x e 
y pertenecientes a A son comparables. Un ejemplo de conjunto totalmente ordenado es el de los números naturales con la 
relación "menor o igual”. 

Sea A = (1,2,3). Ahora veamos cómo se ordenan sus subconjuntos bajo la relación de inclusión. 

Los subconjuntos posibles de A son: 


0, (13, (2), (3), (1,2), (1,3), (2,3), (1, 2,3) 

Cumple las propiedades reflexivas, antisimétrica, y transitiva, sin embargo no es totalmente ordenado, analicemos algunos 
pares de subconjuntos: 

1. Para los subconjuntos (1) y (2), ninguno está incluido en el otro ((1) £ (2) y (2) £ ([1)), por lo tanto, no hay 
relación de inclusión definida entre ellos. 

2. Para los subconjuntos (1,2) y (2,3), tampoco hay relación de inclusión definida entre ellos ((1,2) £ (2,3) y (2,3) £ 
(1,2). 

3. Sin embargo, para otros pares como () y (1), o (1) y (1,2), hay una relación de inclusión definida entre ellos. 

Por lo tanto, el conjunto de subconjuntos de A ordenado por inclusión es parcialmente ordenado pero no totalmente 
ordenado debido a la falta de comparabilidad entre algunos pares de subconjuntos. 


5 Aplicaciones 


Se pueden entender como un tipo de relaciones entre conjuntos. Así una aplicación entre A y B es una relación entre A y B 
donde el dominio de la relación coincide con A y el grafo de la misma es funcional ? Se define una aplicación F de A en B 
como una terna [F, A, Bj en la que F' es una parte del producto cartesiano A x B que verifica las siguientes condiciones: 


1. Vx € A, XAx,y) € F 


2. No existen pares distintos en / que tengan el primer elemento igual 


El dominio de f es Domf = f[xlxw € A,(x,y) € F] y el recorrido de f es Recf = “yly € B,(x,y) € F). En general el 
recorrido de f es un subconjunto de B pero no coincide con este y cuando lo hace se dice que F' es exhaustiva.* 


2cada elemento del conjunto de partida A está relacionado exactamente con un elemento del conjunto de llegada B 
3Es decir, además de todos los elementos de A, están todos los elementos de B 
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5.1 Tipo de aplicaciones 


Sea una aplicación f : A—> B diremos que: 


e Es inyectiva cuando Vx, y € AnIAY=> f(x) 4 f(y) 


e Es suprayectiva cuando el recorrido f(A) = B. Es decir, que Vy € BJx € Alf(x) = y 


e Es biyectiva cuando todo elemento y € B es imagen de un único elemento x € A. Es a la vez inyectiva y suprayectiva 
y se verifica que el cardinal de A es igual que el de B. 


e Es constante sobre una parte M de A si Vx,y € M se verifica que f(x) = f(y). Por ejemplo, f(x) =5 six <0 y 
Fx) = 2? six > 0. Aquí, f es constante sobre M = [zx € R | z < 0], pero no en todo R. Si M es equivalente a A 
simplemente diremos que la aplicación es constante. 


A B A B A B OA B A  B 
o o o o o o o o o 
o o o o »>0 o _ o o 
TT o RA o ——=0 o o Ze 
Qt o yA o o 
NO es Función Inyectiva Sobreyectiva Biyectiva 
función general (no sobreyectiva) (no inyectiva) (inyectiva, sobreyectiva) 
A tiene B puede tener B no puede tener Cada B tiene A relacionado con B 
más de un B más de un A más de un A algún A perfectamente 


Otras propiedades a tener en cuenta sobre las aplicaciones son: 
e Parte estable de una aplicación: Diremos que M C A es una parte estable de la aplicación f si Vx € M => f(x) € M. 


e Aplicación identidad se define como ¿4 : A> A si ¿a(%) = x,Vx € A. Evidentemente esta aplicación es biyectiva. 


6 Estructuras Algebraicas 


6.1 Leyes de composición 


e Ley de composición interna: Dado un conjunto B, una ley de composición interna (*) definida en B es una aplicación 
del Bx B en B. Siendo f: A> B donde ACB xB. f hace corresponder a cada par de elementos (x,y) € A otro 
elemento z € B y lo representamos como t*y= Z. 


e Ley de composición externa: Sean A y B conjuntos no vacíos, una ley de composición externa de A sobre B es una 
aplicación p : Ax B > B. 
6.2 Propiedades de las leyes de composición internas 


Sea las leyes de composición internas (+) y (+) a las que llamaremos suma y producto y se leerán más” y ”por” respectivamente 
definidas en un conjunto A, pueden darse las siguientes propiedades: 


e Asociatividad: Vx,y,2 € A=> (1x*Yy)xz2=x* (yx 2) 
e Conmutatividad: Vr, y E A>1x*Yy=Yx*T 


e Distributividad de (*) con respecto a otra ley de composición interna (+): Por la izquierda Vx, y,2 € A=> ix (y+2) = 
(2x y) + (1* 2) o análogamente por la derecha Vx, y,2 € A=>(2+y)x2=(20x2)+(yx2) 


e Elementos regulares (principio de simplificación): un elemento z € A es regular por la izquierda si Vx,y € A tal que 
2xx=2xYy > 1 = y, análogamente será regular por la derecha si Vx,y € A tal que 1*z=Yx2 => =Y. 2 será 
regular si lo es por la izquierda y por la derecha. Este principio se denomina también de cancelación y se dice que la 
ley de composición interna es cancelativa. 


e Existencia de neutro: Si existe e € A tal que Vr € A>x*e=ext=x 


e Existencia de simétricos (con elemento neutro e): Existen simétricos si para cada elemento x € A existe un elemento 
x' € A tal que xx =x'*x=e. Si cumple la propiedad asociativa y existe simétrico este es único. Demostración: 
Suponemos que existen dos simétricos a x € A queson x' y 1“, entonces 1 = xe = ax(axa O) = (ara) =exx= aq" 
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6.3 Definición de estructura algebraica 


Es una conjunto de leyes de composición interna o externa, definidas cada una de ellas en todo o en parte de un mismo 
conjunto A, y relacionadas con las propiedades que las liguen. Por ejemplo una estructura algebraica es la definida en el 
conjunto de los número enteros por las operaciones suma y producto ligadas entre sí por la propiedad distributiva. Según 
los axiomas elegidos las estructuras algebraicas reciben distintos nombres como grupos, anillos, cuerpos, espacios vectoriales, 
etc; Si en un mismo conjunto A hay que definir dos colecciones de leyes compuestas y no existe ningún axioma que las ligue 
habrá que considerarlas dos estructuras diferentes. 

Sean A y B dos conjuntos, si definimos dos leyes de composición interna x* y o. La ley x definida sobre A y la ley 
o definida sobre B, diremos que una aplicación f : (4,*) > (B,o) es un homomorfismo si se verifica que Vx,y € A => 
Flaxy)= f(x) o f(y). Por ejemplo, la función exponencial exp : R > R*, definida como exp(x) = e”, es un homomorfismo 
entre el conjunto con la suma de los números reales R y el conjunto con la multiplicación de los números reales positivos R*. 
La propiedad que cumple la función exponencial es que para cualquier par de números reales x e y, se tiene que e? PY = e" .e?, 


e Cuando en un homomorfismo la aplicación f : (4,+) > (B,-) es biyectiva se trata de un isomorfismo y g: B > A 
será isomorfismo también. Consideramos el conjunto Za y la operación interna +4 y el conjunto (1, —1,1,—i¿) con la 
multiplicación. Definimos la aplicación $ : Za —> ([1,—1,%, —¿) con (0) = 1, d(1) = 1, 9(2) = —1, y 0(3) = —¿. La 
aplicación es biyectiva y por tanto un isomorfismo, por ejemplo: (1 +2) = $(3) = —i y 9(1) -$(2) =1- (-1) =-—¿ 


e Cuando en un isomorfismo A = B y coinciden las leyes internas es un automorfismo. Por ejemplo la aplicación del 
conjugado en el conjunto de los números complejos sin el cero con la multiplicación: H(21 + 22) = 2122 = 21:22 = 


p(21) - b(22) 
e Cuando en un homomorfismo f : A > B es inyectiva se trata de un monomorfismo, si es suprayectiva es un epimorfismo. 
e Si en un homomorfismo la aplicación se realiza en una estructura algrebraica sobre si misma, es un endomorfismo. 


e Núcleo de un homomorfismo: Sean (G,x*) y (G1, +) dos grupos y f un homomorfismo de G sobre G1, llamamos núcleo 
de f y lo representaremos por ker(f) al conjunto de los elementos de G' cuya imagen dada por f es el elemento neutro 
de G. 

ker(f) =fx]lx e G, f(x) =e, € GP 


6.4 Esquema general de las estructuras algebraicas 


ESTRUCTURAS ALGEBRAICAS 
Cx 


Grupo 


1LCI (o) 1 2 LCI(+ y”) 
(C. +) 


Asociatividad 


Se le agrega 


* Asociativa 
* Distributiva con respecto a + 


Si además ” es conmutat iva 


Grupo 
Abeliano 
(C-(0), *) 

Con unidad 
Sim divisores de 0 


Dominio de Integridad 
*|¡Distrbutiva con respecto a + 


Inversos 
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6.5 Semigrupo 


Sea un conjunto A y una ley de composición interna (*) definida en todo A, constituyen un semigrupo si se satisface la 
propiedad asociativa. 

Si además existe elemento neutro estamos ante un semigrupo unitario o si cumple la propiedad conmutativa es un 
semigrupo abeliano. 

Por ejemplo (N, +) es un semigrupo abeliano unitario. 


6.6 Grupo 


[G,x*) tiene estructura algebraica de grupo si la ley de composición interna verifica: Asociativa, elemento neutro, elemento 
simétrico y si además si satisface la conmutativa se dice grupo abeliano. Por ejemplo, (Z, +) Diremos que un subconjunto 
H de un conjunto G es un subgrupo de G si A es un grupo respecto a la misma operación de G. Un subconjunto sería los 
números pares enteros H =(... — 4, —2,0,2,4...) con respecto a Z 


6.7 Concepto de clase adjunta 


Sea el grupo (G, x*) y un subgrupo H se denomina clase adjunta de A por la izquierda a cada subconjunto a * H con a € G. 
Análogamente por la derecha será H x a. Se dice que H es divisor normal de G si para cada a € G,ax H=Hxa. Si G es 
un grupo abeliano todo subgrupo es divisor normal. 

Dado un grupo G y un divisor normal N se define una relación R entre los elementos de G de la forma Ry => xy E ÑN, se 
puede demostrar que es relación de equivalencia y cada una de las clases de equivalencia coincide con la clase adjunta. 
Dado un grupo (G,x) y un divisor normal N, el conjunto de clases adjuntas con la operación * tiene estructura de grupo. 


6.8 Anillos 

Dado un conjunto A y dos leyes de composición interna, + y * definidas en todo A, (4,+,*) es un anillo si las leyes cumplen: 
1. (4,+) es grupo abeliano 
2. Propiedad asociativa para la segunda ley x 
3. Propiedad distributiva de la segunda ley x* sobre la primera + 


Además si la segunda ley es conmutativa se denomina conmutativo. Si la segunda ley tiene elemento neutro, se denomina 
elemento unidad y el anillo será unitario o con elemento unidad. En este caso se suele decir que [A,+,*) es un anillo con 
elemento unidad. Por ejemplo, El conjunto M de las matrices reales de orden 2 con la adición y multiplicación de matrices 
es un anillo no conmutativo con elemento unidad. 

Un anillo conmutativo con elemento unidad, en el que no hay divisores de cero distintos de cero mismo se denomina 
dominio de integridad. Es decir, no existen elementos a y b, distintos de cero, tales que su producto sea cero. Por ejemplo, 
un dominio de integridad serían los números enteros con la suma y el producto. 

Dado un anillo (4, +, *) decimos que un subconjunto H C A es un subanillo de A si H es un anillo respecto a las mismas 
operaciones que A. Dicho de otra forma, un subconjunto H de un anillo [A,+,x*) es subanillo si para cada x,y € H se 
verifica que x= + (—y) € H( —y es el simétrico de y con respecto a + )ax*y € H y yxax € H. Dentro de los subanillos 
distinguiremos un tipo especial, los ideales: 


e Ideal por la izquierda: Dado un anillo (4,+,x*) un subconjunto Y C A es un ideal por la izquierda si: 


Vr yel >u+(=y EDA(VWrelAV2zcA=>ux*z2€El) 


e Ideal por la derecha: Dado un anillo (4,+,+*) un subconjunto Y C A es un ideal por la derecha si: 


(Vr. yel>u+(=y EDAWrelAnV2zE A>2xxEl1) 


Cuando es ideal por la derecha y por la izquierda se le denomina ideal bilátero. Por ejemplo Para todo entero relativo k, k-Z 
es un ideal de Z. 


6.9 Cuerpos 


Un conjunto K y dos leyes de composición interna + y * definidas en todo K, [K,+,*), es un cuerpo si las leyes de 
composición cumplen las siguientes propiedades: 


1. (K, +, *)satisface las propiedades que lo caracterizan como anillo conmutativo con elemento unitario. 
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2. [K,x), es grupo abeliano 
Sea [K,+,*) definida K* de K parte positiva si verifica: 
e El cero no es positivo, 0 £ K*. (0 elemento neutro de +) 
e Propiedad de tricomía: Vr € K>xE€EK*Vx=0V-=xEK?* 
e Estabilidad de la ordenación: Vx, y € KF=>x+yEKFAI*YyEKT+ 


Se define un cuerpo ordenado tal que xr < y > y +(=x) € K*. Decimos que un cuerpo (K,+,x*) ordenado está 
arquimedianamente ordenado si (Vx € K,3n € Klzx < n). 


6.10 Espacios Vectoriales 


Si tenemos un grupo abeliano (V, +) y un cuerpo (K, +,x*) tal que la ley externa xx: K x V > V, siendo (k,v) + k* vu 
cumple Vk,k' € K y VWv,weV: 


e (E4+k)xv=kx*v+KkKx0 
e (kxk)x*v=kx(k' xv) 

e kx(u+w)=kxv+kxw 
elxvu=vuv 


Entonces diremos que (V, +) es un K-espacio vectorial. Por ejemplo, el plano euclidiano bidimensional IR? es un R-espacio 
vectorial. 


7 Aspectos didácticos 


Este tema no aparece como tal en las órdenes por las que se estable el currículo de la ESO y el Bachillerato. Desde 
las primeras etapas del aprendizaje matemático, se hace uso implícito del estudio de las estructuras algebraicas y sus 
propiedades. Asimismo, la teoría de conjuntos constituye un componente inherente en el desarrollo de las matemáticas 
durante la educación secundaria. Por lo tanto, sería interesante incluir una breve presentación de este tema en el curso de 
1”Bachiller de matemáticas. 

También con respecto a desarrollar la competencia sobre ” Valorar la contribución de las matemáticas al desarrollo de los 
distintos ámbitos del conocimiento humano desde una perspectiva de género y multicultural” será muy importante reconocer 
la aportación de Emmy Noether en la teoría de grupos con su teoremas de isomorfismo. 
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1 Introducción 


El matemático alemán Grassmann es reconocido como el primero que introdujo la idea de un espacio vectorial (aunque no lo 
llamó de esta manera, sino sistema de números hipercomplejos) y de independencia lineal en s.XIX. Desafortunadamente su 
trabajo era muy difícil de leer y no recibió la atención que merecía. 

Unos cincuenta años después Peano en su libro «Calcolo geometrico> acalaró el trabajo de Grassmann y estableció los 
axiomas de espacio vectorial como los conocemos en la actualidad. En este mismo libro introdujo las operaciones de conjuntos. 
Sus notaciones U, N, € son las que todavía utilizamos, aunque no fueron aceptadas de inmediato. 

La definición axiomática de Peano de un espacio vectorial también tuvo muy poca influencia durante muchos años. Su 
aceptación se produjo en el siglo XX, después de que Hermann Weyl la repitiera en su libro «Space, time, matter> una 
introducción a la teoría de la relatividad general de Einstein. 

También podemos mencionar a William R. Hamilton, que durante los veinte últimos años de su vida, dedicó la mayor 
parte de su creación matemática a desarrollar la teoría de un tipo especial de números, los cuaterniones. Con estos trabajos 
cimentó la moderna noción de vector. Todavía hoy se utiliza la notación 1,73, k de Hamilton para los vectores de la base 
canónica en el espacio tridimensional. 

Para desarrollar este tema, consideramos conocidos los contenidos del tema 11 “Conceptos básicos de la teoría de conjuntos. 
Estructuras algebraicas” de este mismo temario. 


2 Espacio vectorial real 


2.1 Definiciones 


Dado un conjunto V 4 f), R el cuerpo de los números reales y dos leyes de composición, una interna + en V y otra externa 
- en V con escalares en R. (Denotamos a los elementos de V con letras latinas minúsculas o con una flecha sobre ellas y los 
llamamos vectores y llamamos escalares a los elementos de R y se denotan con letras griegas). 

(V, +, -;) es un espacio vectorial real si: 


e (V, +) es un grupo abeliano, es decir, la operación suma, definida como la aplicación 
-H:iVxV>ov 


(u,v) >+u+v 


verifica las siguientes propiedades: 


Propiedad asociativa: (u+v) + w =u+ (v+w)Vu,v, we V 
— Existe elemento neutro (0): 30 € V tal que Vu € Vju+0=0+u=u 


— Existe elemento opuesto: Vu € V, X(—u) € V tal que u+ (—u) = (-u) +4u=0 


— Propiedad conmutativa: u+uv=v+u, Vu,v€ V 
e La aplicación producto por escalares o números reales: 
RIRxV>oVv 
(a,u) >a-u 
cumple las siguientes propiedades Vu, v € V,Va, PB ER: 


— Propiedad distributiva con respecto a los escalares: (a. +/8B)-u= (a -u)+(8-u) 


— Propiedad distributiva respecto a los elementos de V: a - (u+ vw) = (a: u) + (a - v) 


Propiedad asociativa mixta: a: (B-u) = (a: B)-u 


— Existe elemento neutro: 1 € R|l.-u=u 


Se pueden generalizar estas operaciones para un cuerpo cualquiera K cambiando R por K, entonces se denota (V, +, + x). 
Notemos que -r, se define a izquierda, pero al ser R un cuerpo conmutativo, análogamente se definiría a derecha. 
Consideraremos, generalmente, espacios vectoriales reales. Nos centraremos en éstos pero se desarrollaría igual para un 

K-espacio vectorial. 

Podemos ahora definir la operación diferencia entre dos vectores, u — v, como la suma de un vector u con el opuesto de 

v, es decir, u— uv =u+ (—v). 
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2.2 Propiedades 

Presentamos a continuación las propiedades elementales de los espacios vectoriales, demostramos solo dos a modo de ejemplo: 
e Simplificación: U+vV=U+wW=>V=w,Vu,v,weE V 
e El producto del escalar cero por cualquier vector es el vector nulo: 0-u=0,Vu € V,0€R,0e€ V 
e El producto de cualquier escalar por el vector nulo es el vector nulo: a+-0=0,Va € R,0€ V 


e Si el producto de un escalar por un vector es el vector nulo, entonces el escalar es cero o el vector es el nulo: a. - u = 
0>0a0=0Vu=0 


e El opuesto de un escalar por un vector es el opuesto de su producto: (—a) -u= —(a - u), Va € R,Vu € V 


e Las propiedades cancelativas: 


Va, 6 € R,Vu 4 0 € V se verifica que a-u=P-u=>a=8B 
— Va A0ER,Vu,v € V se cumple que: 4-U=04:VU=>U=V 


e Unicidad del elemento neutro: 310 € V, O elemento neutro de V. 
Demostración: Si existiese otro elemento neutro 0', siendo cualquier u € V entonces u+0=u=u+0' > 0= 0' por 
la propiedad de simplificación de la suma. 


e Unicidad del elemento opuesto: Vu € V, Ju! € V tal que u/ es el opuesto de u, u' = —u 
Demostración: Si existiese otro u” que fuera opuesto de u entonces u+u! =0=u+u"” => u! = u” por la propiedad de 
simplificación de la suma. 


2.3 Ejemplos de espacios vectoriales 


El espacio vectorial más conocido notado como K”, donde n > 0 es un entero, tiene como elementos n-tuplas, es decir, 
sucesiones finitas del cuerpo XK de longitud n. Por dar un ejemplo más concreto, R*% es el espacio vectorial real formado por 
los vectores de dimensión 3 (3 — tuplas) de forma que 


R?= ((2, y, 2)|z, y, 2 € R) 


Otro ejemplo de espacio vectorial serían el conjunto de polinomios, representadas por K,,[x], con coeficientes en K de 
grado menor o igual que n. Como antes podemos concretar definiendo el espacio vectorial R3[x] de manera que: 


Rz[x] = La) +41 -2+a2-17+a3 - 2%|a9,a1,a2, a3 € R] 


3  Subespacios vectoriales 


3.1 Definición 


Dado un espacio vectorial real (V, +,-*) y S € V un subconjunto con S % (), S se dice que es subespacio de V cuando 
(S, +, e) es un espacio vectorial. Por ejemplo, V y 10) son subespacios de V, se denominan triviales. 
Enunciamos el teorema principal que caracteriza a los subespacios: 
Las dos condiciones ambas necesarias y suficientes para que un subconjunto no vacío S de un espacio vectorial V sea un 
subespacio vectorial son: 
Vu, vES,U+FVES 


VAERAVES,a:UES 


Hay que tener en cuenta que la suma y la multiplicación por escalares son las operaciones de V, luego se cumplen todas las 
propiedades, y será suficiente comprobar que con estas condiciones que son internas en $. 

Del anterior teorema se tiene el siguiente corolario: La condición necesaria y suficiente para que un subconjunto no vacío 
S de un espacio vectorial Y sobre el cuerpo R sea un subespacio de V es que: 


Va, BERAU,VES a: Uu+bB:vES 
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3.2 Intersección de subespacios 


Sean S1 y S2 subespacios de V sobre R, se denomina intersección, Sy (52 al conjunto de los vectores de V que pertenecen 
a la vez a S¡ y a S2, es decir: 


Si] Sa = Lu Vlu SiANu Sa) 


Esta definición se puede generalizar: Dados (S;hier, con Y conjunto de índices, subespacios de (V,+,-+*), se denomina 


intersección (| S; al conjunto de vectores V que pertenecen a S,, Wi € I, es decir: 
¡el 


| S: = lu € Vlu e S¡vi € 1) 
1cl 


Se demuestra fácilmente que la intersección de toda familia de subespacios de V es un subespacio de V ya que a-u+BP-v€ 
Sí, Vi E [, por definición de subespacio vectorial. 


3.3 Unión de subespacios 


Sean S1 y S2 subespacios de V sobre R, se denomina unión Si |) S2, al conjunto de los vectores de V que pertenecen a Si o 
Sa, es decir: 


sil )s» = Lu Vlu Si Vu Sa) 


Esta definición se puede generalizar: Dados (S;b;e1, con T conjunto de índices, subespacios de (V, +, -*), se denomina unión 


U $; al conjunto de vectores V que pertenecen a S, para algún ¡ € I, es decir: 
¡el 


US; = lu e Vi e T tal que u € S;) 
¡el 


En general la unión de subespacios de V no es un subespacio de V. 


3.4 Suma de subespacios. Suma directa. 
Sean S1 y S2 subespacios de V sobre IR, se denomina suma Si + S2, al conjunto de los vectores de Y que son suma de un 


vector de S1 y otro de Sa, es decir: 


S1 + S2 =fu € Vlu = uy + ua,u1 € S1 Aus € Sa) 


n 

Esta definición se puede generalizar: Dados Si,..., S,, subespacios de (V, +, 2), se denomina suma ») S; al conjunto de 
¿i=1 

vectores Y que cumplen: 


n n 
Y s, = lu € Vlu = NA € Si,i=1,...,n) 
¿=1 ¡=1 


Se demuestra fácilmente que la suma de toda familia finita de subespacios de V es un subespacio de V, tomemos a, 6 € 


n n 
R,u,v € Y S,, entonces ¿Qu +6P-v € Y) S,? Si se da esta condición será subespacio vectorial por la propia definición: 
¿=1 i=1 


n 


a-u+B.u=a0: Y) 2+8-0) y => (a 2+8- y) Ed S; 
i=1 i=1 a 


i=1 


El último paso se da ya que Vi, (a - 1, +8: y;) € S; 


3.4.1 Suma directa 


Sean S1 y Sa, subespacios de V sobre R, disjuntos, se denomina suma directa: 
s=10H5+>S=81 +82 81 (15 = (0) 


Esta definición se puede generalizar: Dados S;,..., S,, subespacios de (V, +, 2), disjuntos dos a dos, se denomina suma 
directa: 


s=54BH.QO%o30S=S5+..+8218(18, =(0), Vi j 


Análogamente al caso de la suma, se demuestra que la suma directa de toda familia finita de subespacios de V es un 
subespacio de V. 
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4 Variedades lineales 


4.1 Combinaciones Lineales 

Dado H = [us,.....un y, un conjunto finito de vectores de un espacio vectorial V, se dice que u € V es combinación lineal del 
n 

conjunto H si u= Y Q¿-u,a; ER Y a H se le denomina sistema de vectores de V. 


i=n 


Se tienen las siguientes consecuencias de la definición: 
e O es combinación lineal de cualquier sistema de vectores (con a, = 0,Vi). 


e u € V cualquiera es combinación lineal de sí mismo (u = 1- u), luego un vector cualquiera de un de un sistema de 
vectores es combinación lineal de éste: 


e Si w es combinación lineal de 0,,..., Un y U;, VE son combinación lineal de u;,..., um, entonces w es combinación lineal 


de Uj,..., Uqp! 
w=) (0-0) =Y (0: Y (8, u5)) = Y (05: Bjus) 


¿=1 i=1 j=l ¿=1=1 


Teorema: El conjunto L(H) de todas las combinaciones lineales de una familia de vectores H = ([ux,...,un + de V es un 
subespacio de V. A L(H) se le conoce como variedad lineal o subespacio engendrado por H. 


4.2 Dependencia e Independencia lineal 


Un conjunto de vectores H = ([u;,...,un) de un espacio vectorial V es ligado, o sus vectores son linealmente dependientes 
cuando Ja;,..., A, € R, no todos nulos, tal que 41 -Uj +... + O, * Un = 0 

Un conjunto de vectores H = [u1,..., un) de un espacio vectorial V es ligado, o sus vectores son linealmente dependientes 
si al menos uno de ellos se puede expresar como combinación lineal del resto. 

Se demuestra fácilmente que estas dos definiciones son equivalentes. Suponemos que los vectores son linealmente 
dependientes, probaremos que al menos uno de ellos es combinación del resto. Recordemos que al menos uno de los valores 
alpha; 4 0 y que tendrá inverso (a, +), entonces: 


+ Eo, + AO 


— 07 *U] — «e — Qj-1 * Ug-1 — QO41 * Ud — «<< — An * Un = Qj + Us 


=1 
O; 


=-1 =-1 =-1 
go TOA UL — O O 1 Ugo] O Ol Ud — + EQ O + — Oy * Un = Uy 


Tal como queríamos demostrar. En el otro sentido, partimos de que uno de los vectores u¿ es combinación lineal del resto, 
probaremos que la combinación lineal de todos vectores (incluyendo u, es igual al vector nulo. 


01041 + + Qj-1 + U-1 + 0541 + U541 54 +. + Qp * Un = Us 


QU +... + Qj-1 ¿UU + Qj+1 :Uj41 Hb On Un = 0 


La combinación lineal de todos es igual al vector nulo y con no todos los escalares nulos, puesto que el escalar de uz es —1 
Un conjunto de vectores H = [ux,..., up de un espacio vectorial V es libre, o sus vectores son linealmente independientes 
cuando la única combinación lineal de dichos vectores cuyo resultado es el vector nulo es la trivial, es decir, 


01=...=0Q0, =0 


Luego, si un vector es combinación lineal de una familia de vectores linealmente independientes, entonces dicha combinación 
lineal es única. Si suponemos que hay dos, igualándolas y tomando la resta obtendríamos una combinación lineal cuyo 
resultado es el vector nulo, luego los coeficientes deben ser cero (al ser vectores linealmente independientes) y por lo tanto 
los coeficientes de las dos combinaciones lineales deben ser iguales. 


Q1:*U1 TT... + Op * Un =U 
B1:U1 +... + Bn U, =Uu 
(01 — B1) 41 +... + (0 — Bn) : Un =0 


Luz, ..., Un y linealmente independientes => Q4 — B¡ =0,Vi > a, = B;, Vi 


Enunciamos ahora una serie de consecuencias de estos resultados: 
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e Todo vector no nulo de un espacio vectorial es un conjunto linealmente independiente. 

e Todo vector nulo de un espacio vectorial es un conjunto linealmente dependiente. 

e Todo conjunto de vectores H que contienen al nulo es linealmente dependiente. 

e Si A es un sistema de vectores libres, todo subconjunto S € H es también libre. 

e Si S dado sabemos que es ligado, S € H, entonces H es ligado. 

e Un conjunto finito ordenado de vectores sin el nulo es linealmente dependiente si y sólo si algún vector es combinación 
lineal de sus predecesores. 


4.3 Sistema generador 


Un conjunto G de vectores de un espacio vectorial Y se dice sistema de generador de Y cuando cualquier vector u € V se 
puede expresar como combinación lineal de los vectores de G. 

Tenemos el siguiente resultado: Si un conjunto G = fu;, ..., uy + es un sistema de generador linealmente dependiente de un 
espacio vectorial, entonces existe un vector u; € G, que es combinación lineal del resto, tal que GA Lu;) es también sistema 
de generador de V. 


4.4 Base de un espacio vectorial 


e Dado un conjunto B = ([u1,..,Uun ) de vectores de V, B es base del espacio vectorial V si y sólo si B es linealmente 
independiente y sistema generador de V. 


e Un espacio vectorial se llama finito cuando posee un sistema finito de generadores 


e Todo espacio vectorial finito posee al menos una base. 


Si B =(u;,..., un y es una base de V y H = [v1,..., Up un conjunto linealmente independiente pero no sistema generador de 
V, existen Um+1) -.., Um+p Vectores, con m+p= n tal que el conjunto (v1,..., Um+p) es una base de V, dicho de otra manera. 
Este es el teorema de extensión de la base. 

Tenemos ahora que el cardinal de todas las bases de un espacio vectorial finito V coincide, es decir, tienen el mismo número 
de elementos. Al número común de elementos que tienen todas las bases de un espacio vectorial se le llama dimensión. Si 
B = [us,..., Un) es una base del espacio vectorial se escribe dim(V) = mn. Cuando el espacio vectorial está formado por un 
único elemento, siendo éste el nulo,la dimensión es cero. 

Un conjunto de n vectores de un espacio vectorial de dimensión n es base si y solo si son linealmente independientes o 
sistema generador, por tanto: 


e n vectores linealmente independientes de un espacio vectorial de dimensión n forman una base del mismo 
e Todo sistema generador de n vectores de un espacio vectorial de dimensión n es base 


e Todo conjunto con más de n vectores de un espacio vectorial de dimensión n es linealmente dependiente 


5 Aplicaciones entre espacios vectoriales 


Sean E y D dos espacios vectoriales sobre un mismo cuerpo conmutativo K. Se define la aplicación f : E > D como una 
correspondencia entre elementos de E y D tal que 


Vi € E,Xal € D|f(a) = e 


5.1 Aplicaciones lineales 


Podemos utilizar una definición operativa de aplicación como aquella correspondencia entre dos conjuntos en la que a cada 
elemento del conjunto inicial le asignábamos un solo elemento del conjunto final. 

Una aplicación f de E en D es lineal (u homomorfismo) entre espacios vectoriales E y D sobre un mismo cuerpo 
conmutativo K cuando cumple: 


e fíio+y)= f(1) + f(y) Wo, y € E 
e fla-1)=0: f(x), Ve e E,Va € K 
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Estas dos condiciones se pueden reunir en una necesaria y suficiente para que f aplicación sea lineal: 
Vr ye EAVa,BpEK=> fla:1+8-y)=0- fu) +8- f(y) 
Se define Imagen de la aplicación lineal f: 


Im(f) =(x' € Dl3x € E, f(1) =4') = f(E) 


Se define Núcleo de la aplicación lineal f: 
Ker(f) =1w € Elf(u) =0€ Dj) =f*(0) 
Es decir, aquellos elementos de E cuya imagen sea el elemento neutro de D. 


Además si f es una aplicación lineal de E en D. Se verifica que: 


e La imagen del vector nulo de E es el vector nulo de D 
f(x) = fu +0) = fu) + f(0) > F(0) =0€ D 


e La composición de dos aplicaciones lineales es otra aplicación lineal 
e La imagen por f de un subespacio vectorial de E es un subespacio vectorial de D 
e La imagen recíproca por f (f7*) de un subespacio vectorial de D es uno de E 


e Si fu,,..., un, ) es un sistema generador de E, entonces [f(u1),..., f(un)) es sistema generador del subespacio vectorial 
F(E) de D. 


e Si (uz,..., un) es una familia de elementos de E con ([f(us),..., f(un)) sistema libre de elementos de D, entonces 
Luz, ..., Un | también es libre. Sin embargo, en general, la imagen de un sistema libre por una aplicación lineal no tiene 
porque ser libre. 

Consecuencias: Si (uz, ..., Un y es sistema ligado en E, entonces (f (uy), ..., f(un)) sistema ligado de D. 


e Ker(f) es subespacio vectorial de E 
e Im(f) es subespacio vectorial de D. 
e Si Ker(f) e Im(f) son de dimensión finita, entonces E es de dimensión finita y dim(E) = dim(Ker(f)) + dim(Im(f)) 


e Si E es de dimensión finita y [uz,...,un) base de E. Sean conjunto cualquiera de vectores en D, ([v1,...,Un) E D, 
entonces existe una única aplicación lineal f: E => D tal que 


F(u;) = Vi, 1 a 1,..,n 


5.1.1 Aplicaciones lineales inyectivas 


Una función f : X > Y es inyectiva si cada elemento de X es imagen a lo mas de un elemento de Y. 
Una aplicación lineal f de E en D, E y D espacios vectoriales sobre el mismo cuerpo K', es inyectiva si y solo si: 


e La imagen por f de todo sistema libre de elementos de E es sistema libre de elementos de D 


e Ker(f)=(0). 
Si fuese distinto de cero existiría un x tal que f(x) = f(0) = 0 y como es inyectiva, entonces x= 0. Y para demostrar 
la otra dirección: Si existen x y x' tal que f(x) = f(x”) (no inyectiva), entonces f(x — x') = f(0) = 0, entonces x— x* 
esta en el núcleo y por lo tanto es cero, luego x = 2”. 


5.1.2 Aplicaciones lineales suprayectivas 


Una función f : X > Y es suprayectiva si todo elemento de Y es imagen de al menos uno de X. 
Una aplicación lineal f de E en D, E y D espacios vectoriales sobre el mismo cuerpo K, es suprayectiva si y solo si 
Im(f) =D. 
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5.1.3 Aplicaciones lineales biyectivas 


Una función f : X > Y es biyectiva si y solo si es inyectiva y suprayectiva a la vez, es decir si todos los elementos del 
conjunto X tienen una imagen distinta en el conjunto de Y, y a cada elemento del conjunto de Y le corresponde un elemento 
del conjunto de X. 

Una aplicación lineal f de E en D, E y D espacios vectoriales sobre el mismo cuerpo XK, si E es de dimensión finita y 
[uz,..., Un) base de E. Sean conjunto cualquiera de vectores en D, [v1,...,un) € D, tal que f(u;) = 0,1 = 1,...,n. f es 
inyectiva si y solo si 41],...,Un € D son linealmente independientes y es suprayectiva si y solo si U1,..., Un € D son sistema 
generador de D. Por lo tanto será biyectiva, si y solo si v1,..., Uy € D es base de D (linealmente independiente y sistema 
generador). 

Si f es biyectiva es un isomorfismo. Decir que f es un isomorfismo es equivalente a decir que la imagen por f de cualquier 
base de E es base de D. Si f es isomorfismo de E en D, entonces f7! es isomorfismo de D en E. 


A B A B A B 

o de o 7 7 a 

o —=g9 eo- =0 e” = o 

o ——<$0 0. 0 o. ——<0 

o- a o o ———=0 o — y 

e 0. o e —T 
Función Inyectiva Sobreyectiva Biyectiva 
general no sobreyectiva no inyectiva (inyectiva y 

sobreyectiva) 


5.2 Espacio vectorial cociente 


El espacio vectorial cociente E/F de un espacio vectorial E por un subespacio vectorial F, es la estructura natural de espacio 
vectorial sobre el conjunto cociente de E por la siguiente relación de equivalencia: v está relacionado con w si y solo si v-w 
pertenece a F. 


6 Teoremas de isomorfía 


Primer teorema de isomorfía: Sea f una aplicación lineal entre E y D espacios vectoriales de dimensión finita sobre K' cuerpo 
conmutativo, entonces E/Ker(f) e Im(f) son isomorfos. 

Segundo teorema de isomorfía: Sea E espacio vectorial sobre K y S1,S23 subespacios de E, entonces (Si + S2)/S1, y 
S2/(S1 ( S2) son isomorfos. (Tienen la misma dimensión). Si además S1 y S2 son dimensión finita, entonces dim(S1 + S2) = 
dim(S,) + dim(S3) NN dim(S:] n Sa) 


7 Aspectos didácticos 


Este tema, si bien no aparece como tal en las ordenes por las que se establece el currículo del Bachillerato, debido a su 
importancia en estudios posteriores y a que los espacios vectoriales son la estructura básica que subyace en temas estudiados 
en esta etapa y por estudiar en etapas posteriores, como la Universitaria, sería interesante incluir una breve presentación de 
este tema en el curso de 1”Bachiller de matemáticas. 
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1 Introducción 


Hace unos 4.000 años, los babilonios conocían la manera de encontrar la solución positiva de ciertos tipos de ecuaciones 
cuadráticas. En los siglos VIII y IX matemáticos árabes desarrollan el álgebra y permiten que el lenguaje de las matemáticas 
sea mucho más práctico. 

De entre todos los matemáticos árabes cabe destacar al llamado “padre del álgebra” al-Juarismi, al cual entre otras cosas 
le debemos la palabra algoritmo y álgebra. En su tratado de álgebra se pretende enseñar un álgebra aplicada a la resolución 
de problemas de la vida cotidiana del imperio islámico de entonces y aborda las soluciones de las ecuaciones lineales y 
cuadráticas. Una vez superadas la resolución de las ecuaciones de 2% grado la resolución de las ecuaciones de tercer grado 
llego de la mano de Scipione del Ferro y de Tartaglia en el siglo XVI. 

La generalización de los polinomios y la utilización de la terminología actual se gesta en los siglos XVII y XVIII. Descartes 
adopto la letra x para designar la incógnita y comenzó a usar los números enteros, como hoy, para escribir los exponentes. 
Newton generalizo la formula que lleva su nombre para desarrollar un binomio para otros exponentes no naturales. No tan 
conocida pero más general es la fórmula de Leibnitz contemporáneo y “rival” de Newton que generaliza la fórmula anterior 
para la potencia de cualquier polinomio, y no sólo los binomios. 

Hacia el siglo XVIII, el álgebra trascendió de la solución de ecuaciones al estudio de estructuras como grupos, anillos y 
campos. Es en este siglo y a comienzos del siguiente cuando se consigue demostrar el teorema fundamental del álgebra, que 
relaciona el número de raíces con el grado del polinomio. Participes de la demostración de este teorema cabe destacar a 
Gauss y Cauchy entre otros, quien de mano de los números complejos demuestran el teorema que tanto quebradero de cabeza 
durante más de dos siglos. 


2 Definición 


Podemos utilizar una definición operativa de aplicación como aquella correspondencia entre dos conjuntos en la que a cada 
elemento del conjunto inicial le asignábamos un solo elemento del conjunto final. Si tanto el conjunto inicial como final son 
numéricos se llama función. 

Si suponemos que los conjuntos son ambos el mismo conjunto 4, entonces, f : A —> A, sobre el que definimos las leyes 
de composición suma y producto, (4, +, -),definiendo A como un anillo conmutativo con elemento unidad. Es evidente que 
todo lo que digamos sobre A, será válido para cualquier otro anillo conmutativo con elemento unidad o para un cuerpo K 
(siendo habitualmente R ó C). 

Diremos que f : A > A es una función polinómica cuando transforma un elemento x € A en otro mediante sumas, 
productos y potencias de exponente natural. Hay que diferenciar entre los conceptos de función polinómica, una aplicación 
con las características anteriores, y un polinomio, que es la expresión algebraica de la función polinómica. 

Si designamos por x la variable que puede sustituirse por cualquier elemento en A (indeterminado) podemos escribir: 


f(1) Uy aa” + aya” Pa AA Kn 


a este tipo de expresiones se le denomina polinomios en la indeterminada x con coeficientes en un anillo A (a, sucesión 
de elementos de A que son nulos a partir de un ¿ determinado), que se suelen representar por A(x) y podemos escribir 
A = (ag, a,,42,..., 4, ) teniendo en cuenta que cada uno de los términos de esta expresión es un término del polinomio y que 
el exponente de la indeterminada es el grado del término. Con dar el polinomio, la función polinómica no queda determinada, 
estos solo se produce cuando quedan perfectamente definidos los conjuntos sobre los que se actúa. Utilizaremos polinomios 
de Q(z), ya que Q es un cuerpo y por lo tanto reúne todas las características de los anillos. 


2.1 Terminología 


e Grado de un polinomio: es el mayor de los grados de los términos con coefincientes no nulos. 
e Polinomio nulo: aquel que tiene todos sus coeficientes iguales a O (nulos) 


e Polinomio ordenado creciente o decreciente: aquel en que las potencias de la indeterminada están ordenadas creciente 
o decrecientemetne según la ordenación interna de N 


e Polinomio completo de grado n: aquel que tiene todos sus coeficientes hasta el grado n no nulos. 


e Igualdad de polinomios: Dos polinomios A(x), B(x) € Q(x) del mismo grado se dice que son iguales si todos sus 
coeficientes son iguales a¿ = b,, Wi € N 
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3 Operaciones con polinomios 


3.1 Suma 


Dados dos polinomios A = (ap, ..., An), B = (Do, ..., Dm) € Q(z), la suma es una ley de composición interna + : Q(x) xQ(2) => 
Q(<) tal que 
C= A+B = (an + bo, 41 +b1,....),C € Q(x) 


Se cumple grad(A + B) < Max(grad(A), grad(B)). Demostración: Suponemos con grad(A) > grad(B) entonces b, = 0,1 € 
[m + 1,00) y a; = 0,1 € [n+ 1,00) por lo tanto c; = a; + b; = 0,Vi > n por lo tanto el grado como máximo será n. 
La suma de polinomios tiene las siguientes propiedades: 


e Asociativa: VA, B,C € Q(x) > A+ (B+C)=(A+ B)+C ya que a;,b;,,c; € Q > a; + (b; + c;) = (a; +b;,) +; 
e Neutro: El elemento neutro para la suma es el polinomio nulo (0) cuyos coeficientes son todos nulos. 


VA E Q(o), 30€ Q(/A+0=0+ A=A 


e Simétrico (opuesto): VA € Q(x),34' € Q()A+4' =4+A=0,4' =-—A= (—ao,..., An) 


e Conmutativa: VA, B € Q(1) > A+B=B+A ya que a;,b; € Q > a; + db; =b, +; 
Podemos definir la resta de polinomios como: VA, B € Q(x) > A- B=A+(-B) € Q(z). 
Podemos afirmar que el conjunto de los polinomios tiene estructura de grupo aditivo conmutativo. 
3.2 Producto de un polinomio por un escalar 
Dado A € Q(z) y a € Q se establece la ley de composición externa - : Q x Q(z) > Q(x) y se define como: 
VAEQ(1)AVa E Q>0-A= (a: 490, ...,Q: Ap) 
Esta ley de composición de composición externa tiene las siguientes propiedades: 
e VAEQAVa,PBEQ>(a+B):-A=a:-A+B-A 
eVA,BEQAVAEN>a-(A+B)=0-A+o-B 
eVAEQAVa,BEQ>(a-B)-A=0-(B:-A) 
eVAEQNIEQ>1-A=A 


El conjunto de polinomios con estas dos operaciones tiene estructura de espacio vectorial sobre Q. 


3.3 Producto de polinomios 
Dados dos polinomios A = (ag,...,an), B = (bo, ...,b,) € Q(zx) el producto de ambos es una ley de composición interna: : 
Q(z) x Q(z) > Q(z) de modo que!: 
A.B=C=(Co,...,Cn) € Qu), cx = y aj -b; 
k=i+5 


Dados A y B, suponiendo (grad(A) = n) > (grad(B) = m) y atendiendo a la definición de c;, existe un término de grado 
m + mn que será el grado del polinomio del producto, es decir, grad(A - B) = grad(A) + grad(B). 
Las propiedades del producto de polinomios son las siguientes: 


e Asociativa: VA, B,C € Q(z) > A-(B-C) = (A- B)-C ya que con la definición y como el producto en Q es distributivo 
respecto de la suma y asociativo. 


e Neutro: El elemento neutro para el producto es el polinomio E = (1,0, ...) verificándose que 


VA € Q(u), JE € Q()A-E=E-A=A 


e Conmutativa: VA, B € Q(x) >A-B=B-A 


1Ej: c2 = apba2 + a1b1 + azbo, j +1 suman k 
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e Distributiva del producto respecto de la suma: VA = (ag, .., an), B = (do, .., Am), C = (Co, .., cx) € Qla) > A-(B+C) = 
A B+A:-C 
Demostración: Sea A- B = (Po, ...,Pn+m) y A: C = (90, ---,Gn+r) y A: (B+C) = [ro,...,r¿) con t < (n+ max(m, k)): 


Pi = 40 :b, +41 +bi1 +... +44 + do 


dí = Ap Ci +701*C5-1 7 +. T70-* Cp 
T¡=00* (b; + c;) + q1:* (di-1 + C¡—1) +..+ 0Q* (do + co) 
y como a;,b;, Cc EQ >1¡=p;¡+ q, Vi > A-(B+C)=A-B+A-C 
Q(x) con las operaciones suma y producto tiene estructura algebraica de anillo conmutativo con elemento unitario. Si 
comprobamos que Q(x) no tiene divisores de cero podremos afirmar que es un dominio de integridad y esto se cumple 
siempre que los polinomios que utilicemos sean no nulos. 
3.4 Binomio de Newton 


Nos permite el cálculo de las potencias n-ésimas de un binomio (polinomio de dos términos). Va,b € Q,Vn € Nx se verifica 


que: 
(a +b)" = (0) a Y (;) a ls) a+ e a0y” 
n 


Recordemos que (;) = OL Fue el italiano Tartaglia (S.XVI) el creador de esta fórmula, aunque fue Newton (S.XVII) 
quien la generalizó para exponentes no enteros. 


Demostración por inducción: 
1 1 
n=1= (a+b) =a+b= (5)a0+ Je» 


2 2 2 
n=2= (a+b)? = (a+ b) -(a+b)= a? + ab+ ba +b* =a* + 2ab + b?*= (500. (Jer 0% 


Lo suponemos cierto para n— 1= (a +b)""! = (E ar=1p0 + 1] E de 0 is y lo comprobamos para n: 


(a +b)" = (a+b)""" - (a +b) 


co IA E. n—=1X 0-1 
(a +b) =( 0 ) ¡o 1 ): y E acb"*)]. (a +b) 
7 ¿e nd n—1X n-1,1 n=1Y .-2,2 ¡E E n=1N on 
aro" Jr (07 )a rca b” + p pe Dt. + O O 
”— 112% ll A E Md. ot m=1N 0 
ar (0 Jar) + ("77 +("75)0 DOt+ n-1)8? ¿lA LE 


Aplicando la fórmula de Stefeld a aquellos términos que coincidan en a*d?, (45) + de = () y que (rea, =e a) = 


n—-1 
(a +b)"” = (5) ay + (;) + () a0y” 
0 1 n 


(a SE py" E y (+) an kpk 
k=0 


(1) = 1 entonces: 


4 Divisibilidad de Polinomios 
Sean dos polinomios 4, B € Q(x) diremos A/B si: 


3C € Q(o)]A-C=B 


Será equivalente decir que A divide a B, B es múltiplo de A o A es divisor de B. 
Esto define una relación de divisibilidad y es una relación que verifica las propiedades reflexivas y transitivas, por lo tanto, 
es una relación de preorden. 
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e Reflexiva: VA € Q(x) > A/A ya que 31 € Q(a)/4-1= A 


e Transitiva: Sean 4, B,C € Q(z), si A/BAB/C => A/C 
Demostración: 
Si A/B > 3M € Q(2)/4-M=B 
SiB/C>JINEQ(B-N=C 
>A:M.-N=C=> A/C 


Dos polinomios A y B se dicen equivalentes desde el punto de vista de la multiplicidad si son proporcionales, es decir 
A=a-:B,0a € Q. Si dos polinomios equivalentes, además de cumplir la reflexiva y transitiva cumplen también la simétrica, 
por lo que la divisibilidad es para ellos una relación de equivalencia, de aquí que les llamemos equivalentes. Si aplicamos el 
conjunto cociente de esta relación de equivalencia(llamémosla R) el conjunto cociente Q(x)/R está formado por las clases de 
equivalencia 


[4] = (VWP € Q(u): P=a-4,a€ Q)Í 


Así a la hora de estudiar las propiedades de divisibilidad todos los polinomios de esta clase de equivalencia se comportan de 
igual forma. Por sencillez cogeremos el polinomio (canónico) de la clase de equivalencia con coeficiente de mayor grado igual 
a la unidad: A=x"+a,-12771+...+a9 

Propiedades: 


e Si AJB y AJC, entonces Al(a1 - B+02:C),01,%9 € Q 
e Si A|B, entonces A|B - C,VC € Q(zx) 
e Si A|B, entonces A|B” 


e Si A|B, entonces grad(A) < grad(B), siendo la igualdad para polinomios equivalentes 


4.1 Máximo común divisor y mínimo común múltiplo 


Se denomina Máximo común divisor (med): de un conjunto de polinomios 41, A3,..., An € Q(X)/R al polinomio de mayor 
grado que es divisor de todos (mcd(A;,.., An) = D). Cumple las siguientes propiedades: 


o D|A;, Wi € (1, 10) 


e Si Da|A;, entonces grad(D2) < grad(D) 


Se denomina Mínimo común múltiplo (mem): de un conjunto de polinomios A,,A2,..., An € QUO)/R al polinomio de 
menor grado que es múltiplo de todos (mem(Aj,.., An) = M). Cumple las siguientes propiedades: 


e A¡M,Vi € (1,...,.n) 
e Si 4,|Mz, entonces grad(D2) > grad(M) 


Dos polinomios A, B € Q(X) se dicen irreducibles entre sí si se cumple que el mcd(A, B) es de grado 1. 


4.2 Cálculo del máximo común divisor y mínimo común múltiplo del polinomio empleando 
el algoritmo de Euclides 


Sean A, B € Q(x) y R € Q(<z) es resto de la división de A y B entonces mcd(B, R) = mcd(A, B). Como A= B-C+R, 
podemos afirmar que todo divisor de A y B lo es también de R. 
El algoritmo de Euclides nos permite el cálculo del mcd de dos polinomios mediante divisiones sucesivas. Veamos: 


A=B-Ci+Ri 


B=R;:Ca3 + Ra, grad(Ra) < grad(R;) 
Ri = Ra: C3 + R3, grad(R3) < grad(Ra) 


Rn-2 = Rn-1 * Cn + En, grad(R,,) < grad(R,-1) 
Rn-1= Rp * Ca+1 + Rn+1, 9rad(Roy1 = 0) < grad(R,,) 
mecd(A, B) = mcd(B, R¡) = mcd(R;, Ra) =... = mcd(Ra-1, Rp) = med(R,,,0) = Ra 


El mcd es el último resto anterior a 0. 
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Ejemplo: a(x)=3+2x2-x-2=(x+1)-(x-1)-(x+2), b(x)=x2+2x+1=(x+1)(x+1) 


1 +2x?=x-2|x*+2x+1 x?+2x+1]-2x-2 
-2x-2 2 0 =0.5(x +1) 


med(x+2x+1,24+2x+1)=mcd(7+2x+1,-2x-2)=mcd(-0.5(x+1),0)= -0.5(x+1) R (x+1). 


Para calcular el mem recurrimos al siguiente teorema: Sean 2 polinomios A, B € Q(z) > mcd(A, B)-mem(A, B) = A-B. 


5 Descomposición factorial de polinomios. 


Un polinomio A se dice irreducible cuando sólo tiene de polinomio divisor los polinomios de su clase de equivalencia , a.- P 
y los polinomios de grado cero, q. 

Un polinomio B se dice compuesto o reducible cuando no es irreducible y por tanto existe otro polinomio divisor, A de 
este distinto a los equivalentes y de grado cero: A|B. 

Teorema fundamental del álgebra: todo polinomio compuesto (tomaremos representante canónico) se puede expresar 
como producto de polinomios irreducibles (canónicos) de forma única. Esta forma de expresar el polinomio compuesto se 
llama descomposición factorial. 

Corolario: Si un polinomio P es de grado impar, existe al menos un polinomio de grado uno en la factorización. 

Sea un polinomio A € Q(x) diremos que es irreducible cuando su grado es mayor que O y no exista otro B € Q(x) de 
grado menor que el de A y que al dividirlo de resto 0. 


5.1 Raíces de un polinomio 


Decimos b € Q es raíz del polinomio A € Q(x) cuando el valor númerico del polinomio en x= b es 0. El resto de la división 
del polinomio entre (x — b) es O o un polinomio de grado 0. 


5.2 Raíces múltiples 


b E Q es una raíz múltiple de orden n del polinomio A € Q(x) cuando éste es divisible por (1—b)” y no lo es por (2—b)"+*!,; 
dependiendo del valor n, diremos que la raíz es simple si n = 1, doble si n = 2, tripe si n= 3, y así sucesivamente. 

Generalizando podemos afirmar si las b, son raíces distintas de un polinomio cuyo grado de multiplicidad es n;, respectivamente, 
entonces, existe un polinomio P € Q(x) que nos permite escribir A como 


A=(2-b)"-..-(2—by)* -P 


teniendo P la característica de que P(b,) 40 coni=1,...,k 
Demostración: Aplicamos el método de inducción. Si k = 1 corresponde con la definición de raíz múltiple A = (x—b)”.-P, 
P no es divisible para (x — b) ya que A no es divisible para (1 — b)”*!. Lo suponemos cierto para k — 1. 


A= (x > yyy E (x— by 1) 41 z P, P(b;) A 0 


bx E Q es raíz de orden nz € N en A, como b, son raíces distintas, (1 — bx)”* debe dividir a P para dividir a A. Por lo tanto, 


3P¡ € Q(|IP = (a pS by)" -Pj 


y al ser P(b;) 4 0 también P, % 0, por lo tanto, 


A= (x — by as (x od by)" s P; 


6 Fracciones algebraicas 


(Q(2), +) es un dominio de integridad que satisface las propiedades características de los grupos abelianos, mientras que 
(Q(x), -) satisface las propiedades asociativa, elemento neutro, conmutativa, distributiva respecto a + y las características 
usuales de producto por un escalar. 

Se define como fracción algebraica al par ordenado de polinomios 4, B € Q(x) con B no nulo que se representa como 2 
donde A es el polinomio numerador y B es el denominador. 

Entre las fracciones algebraicas, Q(1) x Q(2)x, se define una relación de equivalencia expresada como 


(A, B)R(C,D) + A-D=B-C 


Se satisfacen las propiedades de relación de equivalencia: 
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e Reflexiva:(A, B)R(4,B) S A-B=B-A 
e Simétrica: (A, B)R(C, D) > (C, D)R(A, B) ya que A-D=B.C=>C-.B=D-A 


e Transitiva: Si (4, B)R(C, D) A(C, DIR(E,F) > (A, B)R(E,F) ya que A-D=B.CAC-F=D-E>A-D-C-F= 
B.C-D-E>A-F=B-E=>(A,B)R(E,F) 


Al conjunto cociente Q(x) x Q(x) * /R se le denomina conjunto de fracciones algebraicas denotando por 12) la clase de 


equivalencia de 2. 

Si multiplicamos numerador y denominador de una fracción algebraica por un polinomio no nulo obtenemos otra equivalente 
a la primera. Así si tenemos % y CH 0 entonces (4, B)R(A-C, B -C). 

Si reconstruimos a la inversa este razonamiento, dada una fracción algebraica dividimos numerador y denominador por 
un polinomio no nulo obtendremos otra equivalente a la primera. Si dividimos por D = mcd(A, B) obtenemos una fracción 
reducida: 

A AD 4 


A=4.DAB=B'.D>Z= = 
Bb BD B 


A esta operación la denominamos simplificación de fracciones. 


6.1 Operaciones con fracciones algebraicas 


e Suma: En el conjunto de fracciones algebraicas Q(x) x Q(z) x* /R se define la suma como: 
A C A-D+B-C 

Esta operación no depende de los representantes elegidos y cumple las propiedades asociativa, conmutativa, existe 

elemento neutro ((2)) y elemento simétrico (4) +1) = (2). El conjunto de propiedades definidas sobre Q(x) x 

Q(x) x* /R con la operación suma, +, confiere a este conjunto estructura de grupo aditivo abeliano. 


e Producto: En el conjunto de fracciones algebraicas Q(x) x Q(x) x* /R se defina el producto como: 
A C AC 
NS 
Esta operación no depende de los representantes elegidos y cumple las propiedades asociativa, conmutativa, existe 


elemento neutro ((£)) y elemento simétrico 13) +(4) = (6). Además cumple la propiedad distributiva con respecto 
a la suma. 


(Q(u) x Q(x) * /R,+,-) tiene estructura algebraica de cuerpo conmutativo. 


6.2 Descomposición en fracciones parciales 


La descomposición de fracciones algebraicas en fracciones parciales permite facilitar la integración, resolver ecuaciones 


racionales, simplificar y estudiar comportamientos asintóticos. Sea 5 una fracción en la que mcd(A, B) = 1, fracción reducida, 


siempre podemos expresarla de tal forma como: É = C+4 donde grado(A”) < grado(B) y si grado(A) < grado(B) > C =0. 
Se denomina C' como parte entera de la fracción 4 


a? 
Tenemos las siguientes proposiciones sobre la descomposición de polinomios: 
e Sea 4 una fracción reducida en la que grado(A) < grado(B) y B = Bi-...- B,, son primos entre sí, entonces existe una 
descomposición de forma tal que 
A Az An 
= To... + 
BB; B» 
en donde grado(A;) < grado(B;) con i € [1, m] 
e Sea E una fracción reducida en la que grado(A) < grado(B"”), con m € Zx, se descompone de tal forma que 
0 A O y Am 
BRE = BS IBA Si BO 
en donde grado(A;) < grado(B) con i € [1,m] 
e Sea 5 una fracción reducida con B =a- Bi” -...- Bi" una descomposición de factores irreducibles podemos afirmar 
que > se descompone de tal forma que: 
A A A A A 
O Y A e a e A y o 
B B; Bí Bi" n” 


con grado(A;¿) < grado(B;,) con i € [1,n], j € [1,m]. 


De estas proposiciones se extraerán los corolarios que permiten también la descomposición del polinomio en fracciones 
irreducibles en el cuerpo de los números reales y de los números complejos. 
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7 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachiller. 

El álgebra (en el sentido algebraico y computacional) se comienza trabajando en 1% y 22 de la ESO donde los alumnos 
empiezan a identificar el significado de las letras y las operaciones básicas. En el curso de 32 de la ESO se trabaja con los 
polinomios, operaciones, raíces, división y se introduce la factorización. Es en el curso de 4o ESO cuando se termina de 
estudiar la factorización y las fracciones algebraicas. 
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1 Introducción 


Es bien conocida la importancia de los sistemas lineales en diversas disciplinas científicas, especialmente en las ciencias 
físicas y en las ingenierías. Multitud de fenómenos naturales y sociales se comportan de una manera lineal e incluso aunque 
mucho se comportan así tan solo de manera aproximada se tratan como si fueran lineales para facilitar su estudio inicial. 
Esto explica que las Matemáticas que se aplican a los fenómenos naturales y sociales sea fundamentalmente lineal en un 
primer acercamiento a los problemas y que los sistemas de ecuaciones lineales constituyan un instrumento fundamental de su 
estudio.Existe especialmente una rama, la de la programación lineal, que constituye un importante campo de la optimización 
de sistemas que dependen de relaciones lineales. 

Sin embargo, debemos recordar que las técnicas de resolución de sistemas de ecuaciones lineales fueron descubiertas en 
los siglos XVIII y XIX, hasta esta época solo se consideraban resolubles los sistemas con igual número de ecuaciones que de 
incógnitas, y si alguna ecuación no linealmente independiente se decía que el problema estaba mal planteado. El avance en 
la resolución de ecuaciones lineales vino con el uso de determinantes (Cramer) y más tarde el de Matriz (Hamilton). Otros 
matemáticos importantes en estos dos siglos para la resolución de sistemas fueron D'Alembert, Gauss, Jordan, Jacobbi, entre 
Otros. 

Las ecuaciones nos permiten plantear y resolver sistemáticamente numerosos problemas que, por procedimientos meramente 
aritméticos, resultarían muy laboriosos. Una vez traducido el problema a un sistema de ecuaciones, la resolución de éste se 
reduce a la resolución de este siendo un procedimiento mecánico. Existen diversos métodos que nos permiten resolver de 
manera sistemática un sistema de ecuaciones. La aplicación de uno u otro depende básicamente de la complejidad del sistema 
en cuanto al número de ecuaciones y de incógnitas. Así, para resolver sistemas de dos o tres ecuaciones lineales con dos o 
tres incógnitas respectivamente, se utilizarán los métodos clásicos: sustitución, igualación y reducción. Sin embargo, estos 
métodos son poco adecuados a medida que aumenta el número de ecuaciones y de incógnitas. 


e Sustitución: Se elige una variable y una ecuación, se despeja y se sustituye en la otra ecuación, encontrado su valor y 
sustituyendolo en la primera obtenemos la otra variable 


e Igualación Se despeja una misma variable en las dos ecuaciones y se igualan. Obtendremos entonces el valor de la otra 
variable y sustituyendo como ante cualquiera de las dos ecuaciones encontraremos la variable inicialmente despejada. 


e Reducción: Realizamos operaciones en las dos ecuaciones para encontrar una combinación lineal de ellas donde hemos 
eliminado una de las variables. Obtenemos así el valor de la otro y sustituyendo en cualquiera de las ecuaciones iniciales 
encontramos la otra variable. 


Tras aplicar estos métodos pueden obtenerse: 
e Una solución concreta: Sistema compatible determinado (SCD) 
e Infinitas soluciones: Sistema compatible indeterminado (SCT) 
e Ninguna solución: Sistema incompatible 


Si representamos gráficamente las ecuaciones (despejando una variable y en función de la otra) obtendremos dos rectas que 
se cortan en un punto (SCD), la misma recta (SCI) o dos rectas paralelas (SI). 


Dejando estos métodos aparte en este tema se revisan los principales métodos para resolver sistemas de ecuaciones lineales 
con m ecuaciones y n incógnitas. 


2 Definiciones generales 


Expresión algebraica: Conjunto de letras o letras y números ligados por los signos de las operaciones algebraicas. 

Ecuación: Igualdad de dos expresiones algebraicas 

Ecuación lineal con n incógnitas o ecuación algebraica de primer grado en 27,..., Un: 41121 +... +4 En =b con a7,..., An, b 
números dados. Siendo z2;,..., Un las incógnitas, a1,..., dy los coeficientes y b el término independiente. 

Combinación lineal de varias ecuaciones: Una ecuación es combinación lineal de dos o más ecuaciones si se obtiene al 
sumar esos ecuaciones multiplicadas por coeficientes escalares. 
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Ecuaciones linealmente dependientes: se dice que varias ecuaciones son linealmente dependientes si hay una combinación 
lineal de ellas que es igual a cero, sin que sean cero todos los coeficientes de la combinación lineal. 

Ecuaciones linealmente independientes: un conjunto de ecuaciones es linealmente independiente si ninguna de ellas puede 
ser escrita como una combinación lineal de las restantes. 

Sistema de m ecuaciones con n incógnitas y coeficientes en K': conjunto de ecuaciones lineales con las mismas n incógnitas 
y cuyos coeficientes pertenecen al cuerpo K. Se representa: 


01171 +... + OinTn = b1 
a¡¡ coeficiente de la incógnita 2; en la i-ésima ecuación,a¡¿ € K,b, € K 


Aam1iT1 +... + AmnTn = Om 


Representación matricial: Se suponen conocidos los contenidos básicos del tema 18 de este mismo temario. 


eN (6x,) b= (5) 


Ax = b, con A = (a1,...,4n) € KM = (aj) y x= a ). Es decir, A es la matriz de coeficientes y añadiéndole b, 


Ax = (A]b) = (a1,..., An, b) es la matriz ampliada del sistema de ecuaciones. 
Resolver un sistema de ecuaciones lineales significa encontrar una n-tupla (20, ..., 19) € K” que verifique las ecuaciones: 


0 0 
011773 o din Tn = b1 


m2 Ho. + nn LA = be 


A dicha n-tupla se la denomina solución o raíz del sistema de ecuaciones lineales. Este sistema será incompatible (S.I) si 
carece de solución y sistema compatible si admite alguna solución. En el caso de que esta solución sea única el sistema se 
denomina compatible determinado (S.C.D) y si hay infinitas soluciones será un compatible indeterminado (S.C.I). Se llama 
solución general del sistema al conjunto de soluciones de un sistema y solución particular a un elemento de este conjunto. Si 
toda solución de un sistema de ecuaciones cumple otra ecuación, ésta es consecuencia de las del sistema. Si una ecuación es 
combinación lineal de varias, es consecuencia de ellas. 


2.1 Sistemas de ecuaciones lineales homogéneos y no homogéneos 


Un sistema de ecuaciones lineales Ax = b es homogéneo si b = 0, en caso contrario es no homogéneo. Los sistemas homogéneos 
tiene las siguientes propiedades: 


e Si (y1,..., Yn) solución para un sistema homogéneo => (ky, ..., kyn) también Vk € K. 
e Si (y1,..., Yn), (Y), ---, Y, ) soluciones para un sistema homogéneo > (ky1 + K'y, ..., kyn +K'y;,) también Vk, k! € K 


e El (0, ..., 0) es solución de todo sistema homogéneo, luego no puede ser un sistema indeterminado, es siempre compatible, 
y en el caso de ser compatible determinado su única solución será esta. 


3 Equivalencias entre sistemas 


Dos sistemas de ecuaciones lineales con el mismo número de incógnitas (n) son equivalente si tienen las mismas soluciones. 
Los sistemas equivalentes han de tener el mismo número de incógnitas pero, no necesariamente, el mismo número de 
ecuaciones. 


3.1 Formación de sistemas equivalentes 
Teorema: Dado un sistema de ecuaciones lineales se tiene: 
e Si multiplicamos una ecuación por un número real % 0, se obtiene otro sistema equivalente al dado 
e Si una ecuación es combinación lineal de otras, entonces el sistema obtenido al suprimirla es equivalente. 


Teorema fundamental de la equivalencia: Si en un sistema de ecuaciones se cambia una ecuación por otra que es combinación 
lineal de ella y de las restantes, siempre que el coeficiente de la ecuación sustituida sea distinto de cero, se obtiene otro sistema 
que es equivalente al primero. 

Corolario: Para resolver un sistema de ecuaciones lineales basta resolver un sistema equivalente, en el que ninguna ecuación 
sea combinación lineal de las restantes. 
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4 Discusión de sistemas lineales 


Como hemos presentado inicialmente podemos clasificar los sistemas de ecuaciones lineales según si existe o no solución. Para 
poder proceder a esta clasificación podemos servirnos del cálculo del rango de la matriz. 


4.1 Rango de una matriz 


Lo que vamos a estudiar en esta sección son las bases para poder resolver los sistemas de ecuaciones desde su expresión 
matricial. 

Siendo A matriz de orden m x n, cualquier matriz que se obtenga de ella suprimiendo ciertas filas y columnas se llama 
submatriz (suponemos conocidas definiciones y propiedades del tema 19 de determinantes). 

Se denomina menor de orden h de la matriz A al determinante de la submatriz que se obtiene al suprimir (m — h) filas y 
(n — h) columnas de la matriz A. Por lo tanto la dimensión del menor es h x h 

Y se llama menor principal de orden h a todo menor no nulo de orden h de una matriz A. 

Se llama rango h de la matriz A, rg(A) = h si existe, al menos, un menor de orden A distinto de cero, siendo nulos todos 
los menores posibles de orden superior h. Si rg(A) = r, se denomina defecto de A a n—r. 

De estas definiciones se extraen las siguientes consecuencias: 


e Si en A se intercambian entre sí dos filas (o columnas) 1, j se obtiene otra matriz A” de igual rango que A 


e Si una fila (o columna) de A está formada por ceros, el rango de A es igual al de la matriz resultante al eliminar esa 
fila o columna. 


e El rango de la matriz nula es O y es la única cuyo rango es 0 
e Para toda matriz de orden n con |4| 40 = rg(4) =n 
e Teorema: El rango de una matriz coincide con el número de sus filas o columnas linealmente independientes. 


Regla práctica para el cálculo del rango Sea A una matriz m x n, supongamos que se encuentra un menor de orden 
h 4 0. Para determinar si el rg(A) = h se han de estudiar todos los menores de A de orden p con h < p < min(m,n). 

Si se anulan todos los menores de orden p fijo de A, se anulan todos los de orden q con q > p. Por lo tanto, bastará 
comprobar que son nulos lo de orden h +1. De aquí obtenemos la siguiente regla: Sea q un menor no nulo de orden h. 
Añadimos a este menor una fila y cada una de las columnas que no están en a (a esto se le denomina orlar a a: con estas fila 
y columnas). Si obtenemos que todos los determinantes son cero entonces la fila es combinación lineal de las h filas de a: y se 
puedes prescindir de ella. Análogamente con las demás filas, si son cero los determinantes de todas ellas, entonces solo tiene 
las h filas independientes de a y el rango es h. Si no son nulos todos los determinantes, se procede con el no cero como a y 
se repite el procedimiento. 


2 000 

0000 
Ejemplo: Calcular el rango de la matriz siguiente: A = 

0030 

00.00 


|A]=0 (luego no es de rango 4) 
Veamos que todos los menores de orden 3 son cero: 


200 200 200 200 200 
0 0 0=0 [0 0 
0:03 000 030 0.00 000 


uy 
Il 
o 
o 
[=) 
1 
o 
o 
uy 
[a] 
1 
o 
o 
o 
[=>] 
Il 
o 


200 200 0.00 0 0 0.00 
0 0 0=0 [0 O 0O/=0 [0 0)=0 ¡0 3 0O)=0 [0 0 0/=0,etc. 
0.00 0.00 0.3 0 0.00 000 


Sin embargo, 


] =6%0, es un menor de orden 2 distinto de cero, luego es un menor 


3 
principal de orden 2. Luego Rang(A)=2 


Se puede simplificar el cálculo mediante las transformaciones elementales que son: 


e Permutar dos filas (o columnas) 
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e Multiplicación de una fila (o columna) por un número 
e Suma de una fila (o columna) multiplicada por un número a otra fila (o columna) 


A y B se dicen matrices equivalentes si una se obtiene de la otra mediante transformaciones elementales. Teorema: Las 
matrices equivalentes tiene el mismo rango. Luego para calcular el rango de una matriz A, puede calcularse a partir de una 
matriz más sencilla B que sea equivalente. 


4.2 Teorema de Kronecker-Capelli y de Rouché-Frobenius para sistemas de ecuaciones 
lineales 


Sea el sistema general de m ecuaciones lineales con n incógnitas: 


01171 +... + QOinTn = bi 


Aam1T1 +... + AmnTn = Om 


Siendo A matriz de coeficientes a;; y Ax matriz ampliada añadiendo a A la columna de términos independientes. Una vez 
calculado rg(A) = r, para calcular el rg(Ax) hay que orlar el menor principal «+ con la columna de términos independientes 


b; y cada una de las m — r filas que no figuran en él. 


a11 -.- Gin bi 


Se obtienen así determinantes de la forma ,(U=r+1,,..., m); siendo estos los determinantes característicos. 


al1 -< Gin bi 


e Teorema de Kronecker-Capelli: Siendo A matriz de coeficientes a; y Ax matriz ampliada añadiendo a A la columna 
de términos independientes.Es compatible si, y solo si, el rango de la matriz ampliada Ax es igual al rango de la matriz 
de coeficientes A. 


e Teorema de Rouché-Frobenius:Si un sistema lineal de ecuaciones es compatible, y el rango de A es igual al número de 
incógnitas, la solución es única. Si el rango de A es menor que el número de incógnitas, hay infinitas soluciones, cada 
una de las cuales se obtiene dando un sistema de valores arbitrarios a las incógnitas no principales 


5 Resolución de sistemas lineales 


Existen distintos métodos para poder obtener las soluciones, en caso de que existan, de los sistemas lineales. Los más sencillos 
han sido presentados en la introducción, encontraremos a continuación otros más útiles para mayor número de ecuaciones e 
incógnitas. 


5.1 Sistema de Cramer. Regla de Cramer. 


Se denomina Sistema de Cramer a un sistema de ecuaciones lineales con igual número de ecuaciones que de incógnitas y el 
determinante de la matriz de coeficientes no nulo. 


011. Wa. Tdln Tn = b1 
[A] determinante de la matriz de coeficientes a,¿ no nula 
Aam1T1 +.... + AmnTn = Dm 


Teorema de Cramer: Un sistema de Cramer admite una única solución que viene dada por 


Q11 +... bi «+. Aln 
_—_ |Qmi ... Dm ... Amn 
$ Al 


bi Dn : : E 
con les ) columna de términos independientes en el lugar de la columna i-ésima. 
Este teorema tiene importancia desde el punto de vista teórico, pero el uso práctico es laborioso para valores grandes de 
n, Pues se tienen que calcular n + 1 determinantes de orden n, y es inadecuado para sistemas en los que | A] tiene un valor 
próximo a 0. 
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5.2 Método de Gauss 


Consiste en transformar un sistema en otro equivalente de forma que sean nulos todos los coeficientes que estén por debajo 
de la diagonal principal en la matriz de coeficientes. Resolviendo este se resuelve el primero, por el teorema fundamental de 
equivalencia se puede suprimir cualquier ecuación que pueda obtenerse a partir de las otras ecuaciones. Este método es el 
más rápido. 

Lo razonamos utilizando un sistema de 3 ecuaciones y 3 incógnitas por comodidad: 


a11 412 413 [aja B A A B A A . a11 412 Q13 lara 
A=| a21 a2 ar lazs > EF =011 :F5* — 091 : Fí , F3 =0a11 E = 031: Fj > equiv(A) = B = O b22 b23 lb24 ] => 


31 432 U33 [aa O b32 b33 |b34 


C és 5 : a11 412 413 lara 
=> F3 = baz * F3 — b39 * E => equiv(A, B) =C= O ba2 b23 |b24 


0 0 c33 lc34 


C34 b24—b23:23 — 414012201383 
Suponemos q11 0, ba2 0, 033 0 3 6330 Ta 39 ¿Tg= En . 


Siendo b22 = G11 : 422 — 091 * 012, b23 = 0411 * 423 — 491 : 013, b24 = 0411 * 424 — G21 * 014 
b32 = 411 * 432 — A31 : 412,b33 = 411 * 433 — Ag1 * Q13,b34 = 011 : 34 — Qg1 + 014 
€33 = ba2 : b33 — b32 * ba3, 034 = Daz : b3a — b32 : bas 

A continuación veamos la discusión del sistema: 


e Puede aparecer alguna ecuación absurda 0 - 2; = C;¿,Ci¿ 40=> S.L. 


e SinoesS5.l. y aparece alguna ecuación 0-1 = 0 => S.C.I, el número de incógnitas es mayor que el número de ecuaciones 
no triviales (ya que en este caso tomábamos inicialemente número de ecuaciones igual a número de incógnitas, tres) 


e Si se dan ninguna de las situaciones anteriores es S.C.D, ya que en este caso, el número de incógnitas y de ecuaciones 
no triviales coincide. 


El método de eliminación de Gauss es independiente del teorema de Rouché-Frobenius y de la regla de Cramer. Y además 
de servir para resolver el sistema de ecuaciones lineales es un nuevo procedimiento para calcular el rango de una matriz. 


5.3 Método de eliminación de Gauss-Jordan 


Es una modificación del método de Gauss, consiste en eliminar no solo cada incógnita de las ecuaciones posteriores si no 
también de las anteriores. La ventaja es que se obtiene la solución del sistema directamente. 


: a11 012 413 lara D C C PD C C 
equiv(A, B) =C = O ba2 ba |b24 ] => Ey” = C33 : F> — baz PF ¿Ej? =C33 Ej = 013: F3 


0 0 C33 lea 


di1 día O |dia4 
> equiv(A, B,C) =D = ( 


E D D . e11 0 0 leza 
0 das 0 dz ] > Fi? = dos: Fi” — dí2 * Fo > equiv[A,B,C,D)=E=| 0 dz 0 das 


0 0 c33 |lc34 0 0 c33 lea 


C34 


214 q. = d24 
C33 


e11? d22? 


Matriz diagonal con 11 = 3 = 


6 Aplicaciones en geometría 


A continuación se presenta una imagen con los valores de los rangos según las posiciones relativas de planos y rectas en el 
espacio tridimensional. Hay una errata en esta imagen, en la posición relativa de 2 rectas, si son coincidentes el rango es 2 y 


si son secantes el rango es 3. 
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2 PLANOS 


a=Ax+By+Cz+D=0 


a=4Ax+Bly+C'2+D'=0 


rangoM = rangoM*=1 


Coincidentes 


rangoM =1 
rangoM * =2 


Paralelos 


rangoM = rangoM * =2 


Secantes 


3 PLANOS 


r=Ax+By+C2+D=0 


ad=4Ax+B'y+C'2+D'=0 


ai= A x+B y+C"24D"=0 


. 


> 


r= 


l 


2 RECTAS 


Ax+B,y+C¡2+D, =0 
A,x+B,y+C,2+D,=0 


Ajx+ Bj y+C¡2+D, =0 
A'x+B,y+C,'2+D,'=0 


RECTA Y PLANO 


Ax+Bjy+Cjz+D, =0 


rangoM = rangoM*=1 


rangoM =1 
rangoM * =2 


rangoM =rangoM * =2 


rangoM = rangoM * = 3 


rangoM = rangoM*=|1 


Coincidentes 


2 coincidentes 
y 1 paralelo 


3 paralelos 


Secantes en 
una recta 
2 paralelos y 1 
secante 


Secantes2a2 


Secantes en un 
punto 


Coincidentes 


rangoM =2 
rangoM *=3 


Paralelas 


rangoM = rangoM * =2 


Secantes 


rangoM =3 
rangoM*=4 


rangoM = rangoM * =2 


Cruzadas 


Contenida en 
el plano 


rangoM =2 
rangoM* =3 


Paralela al 
plano 


A,x+B,y+C,2+D,=0 


rangoM = rangoM *=3 Secante al 
AR plano 


7 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachiller. 

En 2% ESO se introducen los sistemas lineales de 2 ecuaciones y 2 incógnitas. La idea básica que debe desarrollar el 
alumnado es la importancia de manipular las ecuaciones para conseguir que tengan solo una incógnita y a partir de ahí 
completar la resolución del sistema. Por otra parte, no debe descuidarse la resolución gráfica de los sistemas, tanto a mano 
como con herramientas tecnológicas. 

En 3* de la ESO y en 4” se siguen dando estos sistemas pero ahora con más profundidad estructurando más los métodos 
de resolución. 

La resolución de sistemas de 3 ecuaciones se aplica ya en el 1% bachillerato, por las dos opciones (Matemáticas 1 y 
Matemáticas de 1% Aplicadas a CCSS). Es en 2% Bachillerato (ambas ramas) cuando se abordan sistemas de ecuaciones 
lineales de cualquier tipo y se explican el teorema de Rouche-Frobenius, la regla de Cramer y la resolución de sistemas por 
el método de Gauss. 
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1 Introducción 


Las matrices fueron introducidas por Hamilton en el siglo XIX en su obra Lectures on quaternions, como extensión del 
concepto de determinante, aunque el cálculo matricial fue desarrollado algo más tarde por Cayley. En el siglo XX cabe 
destacar a Olga Taussky conocida como ” La antorcha de las matrices” por su relevancia en este área y como iluminó nuevos 
caminos. Su trabajo en este campo incluyó la diagonalización de matrices, al teoría de formas cuadráticas, y la descomposición 
en valores singulares. 

Las matrices son, posiblemente, una de las herramientas matemáticas que se utilizan en los más diversos contextos, desde 
el análisis numérico a la estadística, la economía o la física. Además, conceptualmente hablando, están presentes en la vida 
diaria, el horario de trenes, la tabla de cotización en bolsa, los resultados de los equipos de fútbol, la quiniela, las pantallas 
de televisión y de ordenador son matrices de píxel, etc..... 

Actualmente existen números programas de índole informático que utilizan el concepto de matriz para realizar sus 
operaciones. Este es el caso de las hojas de cálculo, como Excel o Calc, o programas matemáticos y de desarrollo como 
Matlab. 


2 Definiciones y clases de matrices 


Sean los conjuntos finitos de N, I =(1,2,...,mj y J = [1,2,...,n) y un cuerpo K (generalmente se usa R) llamaremos 
matriz de dimensión m x n en el cuerpo K' a toda aplicación de la forma: 


AJÍ xa RS K 
0 j—> MD 


Al conjunto de todas las matrices de dimensión m x n en el cuerpo K las denotaremos como Min xn(K). Habitualmente, 
y en este tema sin pérdida de generalidad, se trabaja con K = R siendo entonces el conjunto de matrices m x n en los reales 
el conjunto denotado como Mim xn (R). 

Las matrices suelen representarse en forma de cajas de m filas y n columnas, en donde la posición i-filas y j-columnas se 
sitúa el elemento a;; de la matriz: 


011 ess din 


A= 


m1 +++ mn 


Algunas veces las matrices también se denotan simplemente A = as; 

Dos matrices son iguales si tienen misma dimensión y cada elemento es igual al que ocupa la misma posición. Es decir, 
A=B+G 01 = bij, WE lL,jEJ. 

Matriz traspuesta de una matriz A, A*, es una matriz que cambia las filas por las columnas, es decir, as = Oji 

Existen muchos tipos de matrices conforme a la relación de sus elementos y a la dimensión de la matriz. Algunas de las 
más importantes son: 


e Matriz cuadrada: es la matriz que tiene mismo número de filas que columnas se puede denotar como M,,(R) 
e Matriz columna: es la que tiene una única columna (n = 1) por tanto Mn x1(R) 
e Matriz fila: es la que tiene una única fila (m = 1) es por tanto Mizn(R) 


e Matriz diagonal: es una matriz cuadrada en la que los elementos de fuera de la diagonal (a;;) son nulos. Es decir aj =0 
siiAj. 

e Matriz escalar: es una matriz diagonal donde todos los elementos de la diagonal valen lo mismo (aj, = k y aj =0 si 
¿A j) 

e Matriz triangular superior cuando los elementos debajo de la diagonal son nulos, es decir a¡¿ = 0,Vi > 


e Matriz triangular inferior cuando los elementos encima de la diagonal son nulos, es decir a¿¿ = 0,Vi < j 


e Matriz simétrica es una matriz cuadrada en la que los términos simétricos por la diagonal son iguales, es decir a;;= ay; 
. Se cumple 4 = A. 


e Matriz antisimétrica es una matriz cuadrada donde los elementos de la diagonal son nulos y los simétricos opuestos 
(as; =0 y as; = —as;). Se cumple 4? =—A 
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3 Suma y producto escalar de matrices. Espacio vectorial de M.,, xy (R) 


Vamos a definir la suma de matrices y el producto escalar de forma que como veremos conferirá al conjunto de matrices de 
estructura de K-Espacio Vectorial. 

Llamamos suma de matrices de la misma dimensión A, B € Mmxn(R) a una aplicación interna que nos relaciona con otra 
matriz de la misma dimensión, A+ B € Mmxn(R) en donde cada término de la matriz igual a la suma de los términos de 
igual posición de las otras dos matrices. 

+: Mmxn X Mmxn > Mmnxn 


A = 045, B = dy; >A+B=a0sj + bi 
Propiedades que convierten a la suma de matrices (Mim xn (R), +) en grupo conmutativo. Las demostraciones son triviales 
al estar definidos los elementos en K (siendo la suma en K grupo): 


e Suma bien definida: es única e interna 
e Asociativa: 
(A+4B)+C=A+(B+C) 
e Elemento neutro: A+0= A. Siendo la matriz O la que todos elementos de la matriz son 0. 
e Elemento opuesto: A + (—A) = 0 siendo la matriz —A = (—a;¿) formada por los opuestos de A. 
e Conmutativa: A+ B=B>+A 


El producto escalar de matrices es una operación externa que relaciona un elemento escalar a € R y una matriz A € Min xn (R) 
con otra matriz de la misma dimensión y definida como «a. - A y donde todos sus elementos se calculan multiplicando por a 
los elementos de 4. 

Rx Mmxn(R) > Min (R) 


0, A =4ij >0:A=0-0j; 
Propiedades: triviales a partir de la multiplicación y suma en K. Va, PB € R y A,B € Mmxn(R): 
e Bien definida: unicidad del producto y producto cerrado + - A € Minxn(R) 


e Distributiva en la suma de matrices: a-(4+B)=0-A+a-B 
e Distributiva en la suma de escalares: (a +/6P)-4A=a0:A+8B-A 
e Pseudoasociativa: PB -(a- A) =(PB-0)- A 

e Elemento unidad: 1-4 = A 


Con las operaciones suma y producto escalar y dadas sus propiedades se cumple que el conjunto de las matrices con estas 
Operaciones son espacio vectorial. Veamos ahora la dimensión y una base de las mismas. 

Proposición: la dimensión de las matrices Mimxn es de dimensión m - n siendo una base el conjunto de matrices 
l11,121,...,1mn con 1; una matriz con todos los elementos nulos menos el que ocupa la posición fila i y columna j que 
vale uno, ajj = 1. 

Además los siguientes conjuntos de matrices son subespacios vectoriales de M,,: 


e Matrices diagonales, que denotaremos D,, (R) 

e Escalares, que denotaremos XK, (R) 

e Triangulares superiores e inferiores Ts, (R), Ti, (R) 
e Simétricas S,(R) y antisimétricas H,, (R) 


Proposición: si A es un matriz cuadrada, A € M,,(R), entonces siempre se puede expresar como suma de una matriz 
simétrica S y una antisimétrica H (A = S + H). Se cumplen que entonces las matrices simétricas y antisimétricas son 
subespacios vectoriales complementarios M,, (R) = S,, O H», 

Demostración: Sea la matriz cuadrada A definimos S = 1/2-(4+ 4%) y H = 1/2-(A— A*). Veamos que generan la 
matriz A, que S es una matriz simétrica y H antisimétrica y que la intersección de S,, y H,, es el conjunto trivial (0), ya que 
entonces se cumplirá que M,,(R)S,, O H,,. 


e Genera A=S+H>S+H=1/2-(4+4*)+1/2-(4- 41) =1/2-(4+ 4'+ A- 41) =1/2-(24)=A 
e Ses simétrica + 5 =1/2-(4+ A*) =1/2- (41 + 4) =S, por la conmutativa de + 
+ Hes antisimétrica + $? =1/2.(4— At)! =1/2-(4'— A) =-1/2-(4- 4!) =H 


e Sn AN H,, = L0p: (as; =0A Qij = ji A € H.,) A (as; = aji] A € Sn) —* (as; —=0j5i 051 V1 0) A (a; = 0,V3 = J). De 
la primera igualdad obetenemos que la única manera de que dos opuestos sean iguales es que aj = 0,Wi 4 j. Por lo 
tanto A=0 
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4 Producto de matrices 


Sean las matrices A € Mmxp(K) y B € Mpxn(K) llamámos producto de A por B, 4-B, a una matriz C = A-B € Mmxn(K) 


tal que: 
p 
cij = Y ais: dp 
k=1 


Y cumple las siguientes propiedades : 
e Asociativa: (A-B)-C=A-(B-C) 
e Distributiva: A-(B+C) =A-B+A-C, con A€ Mmxp(K) y B,C € Mpxn(K) 


e Elemento unidad: A-f, =Im-A=A con A € Mnxn(K), I, se le denomina matriz identidad de dimensión p x p 
siendo una matriz escalar con sus elementos igual a 1. 


Además el producto de dos matrices es equivalente a la composición de dos aplicaciones lineales: 
AB fog,V(g) = A, V(f) =B 


Las únicas matrices del mismo conjunto Mimxn(K) que podemos multiplicar son las cuadradas, pues recordemos que 
las filas de una tiene coincidir con las columnas de la otra matriz. Para las matrices cuadradas M,,(K) el producto es una 
aplicación interna pues el producto de dos matrices 4, B € M,(K) es otra matriz del mismo conjunto. En este conjunto 
de matrices el producto sigue cumpliendo las propiedades definidas de forma general (asociativa, distributiva y elemento 
neutro). Así pues el conjunto de matrices cuadradas con las operaciones de la suma y del producto (M,,(K), +, -) es Anillo. 
La propiedad conmutativa no es cierto para todas las matrices, por lo que el anillo no es conmutativo. 


5 Analogía de las matrices y las aplicaciones vectoriales 


Proposición: podemos establecer una relación isomorfa entre las matrices Minxn(K) y el conjunto de aplicaciones lineales 
entre los K-espacios vectoriales V y W, con dim(V) = mM y dim(W) = m. Esto nos permite poner toda aplicación lineal como 
una matriz y al revés. 

Demostración: si la proposición es cierta podemos establecer una aplicación biyectiva entre los conjuntos Minxn(K) y 
Hom(V, W). Llamaremos a esta aplicación Y : Hom(V, W) => Mmxn(K). Conocer una matriz es conocer los elementos de 
la matriz a,;, y conocer una aplicación f es conocer como se transforma una base de V = [vy,...,u,]) en función de una 
base en W = [w1,..., wm), es decir: 


WN 01-01 + ¿EP RE 1, .... N) 
La aplicación Y la definimos de forma que pase la aplicación f definida anteriormente a la matriz A = as; = 045. Es decir: 


Q11 ... tn 
A = 


QAm1 ++ Amn 


que son las coordenadas de f(v;) en columna. 
Para demostrar que Y es biyectiva, primero demostraremos que es inyectiva y luego que es suprayectiva. 


e Inyectiva: Supongamos que W(f) = W(g) para dos aplicaciones lineales f,g € Hom(V, W). Esto significa que las 
matrices asociadas a f y g son iguales. Es decir, para cada ¿ y j, las coordenadas de f(v;) y g(v;) en las bases 
respectivas son iguales. Entonces, f(v;) = g(v;) para todo ¿, lo que implica que f = g. Por lo tanto, Y es inyectiva. 


e Suprayectiva: Dada una matriz A = [q] en Minxn(K), podemos definir una aplicación lineal f : V —> W tal que f(u;) 
tenga las coordenadas a¿¿ en la base de W para cada 1. Esta definición garantiza que f esté completamente determinada 
por la matriz A, ya que cada entrada de la matriz representa los coeficientes de f(v,) en términos de la base de W. Por 
lo tanto, dado cualquier matriz en Mim xn (K), podemos encontrar una aplicación lineal correspondiente en Hom(V, W). 
Por lo tanto, hemos demostrado que para cada matriz en Mmxn(K), hay una aplicación lineal correspondiente en 
Hom(V, W), lo que implica que Y es suprayectiva. 


e Dado que Y es tanto inyectiva como suprayectiva, es biyectiva. 


Por otro lado las operaciones suma de matrices y producto escalar de matrices serán equivalentes a la suma de aplicaciones 
lineales y al producto escalar en aplicaciones lineales. 
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6 Matrices equivalentes 


Dos matrices A, B € Minxn(K) se dicen equivalentes si provienen de una misma aplicación lineal con diferentes bases y lo 
denotaremos como A = B. La relación anterior se de equivalencia. 

Llamaremos rango de una matriz A, rang(A), a a la dimensión del espacio imagen de la aplicación f asociada, es decir 
rang(A) = dim(Im(f)). Se cumple por tanto que el rango de una matriz es el número de columnas (vectores imagen de f) 
linealmente independientes. Por lo tanto, el rango de una matriz A € Minxn(K) es menor o igual al número de filas, m, y al 
número de columnas, n. Es decir rang(A) < min(m, n). 

Dos matrices son equivalentes si y solo sí tienen el mismo rango. 

Para calcular tanto el rango como la inversa una operación muy importante es el determinante, que se explica en el 
siguiente tema. Calcularemos así rango sin necesidad de usar el determinante, aplicando operaciones de forma que la matriz 
resultante sea equivalente 


e Permutar filas o columnas entre sí. Traducido a aplicación lineal es cambiar el orden de los vectores (columnas) o de 
las coordenadas (filas), operaciones que no modifican la aplicación y por tanto las matrices resultantes equivalentes 


e Multiplicar una fila o columna por un escalar. Traducido a aplicación es multiplicar uno de los vectores, de V o de V? 
por un escalar, por lo que la aplicación sigue siendo la misma al ser los nuevos vectores también base. 


e Sustituir una fila (columna) por esta fila (columna) más otra fila (columna). De nuevo es una transformación equivalente 
pues cambiamos un vector por otro que genera de nuevo una base de V o de V” 


Para calcular el rango de una matriz A utilizaremos las transformaciones descritas anteriormente para llegar a una matriz de 
la forma Ly,de tal manera que rang(A) = rang(Ly) =k 


El procedimiento que se utiliza es semejante a la resolución de las ecuaciones de Gauss, utilizando un pivote para hacer 
los elementos debajo de él en su columna sean cero. Ejemplo: 


1-2 2 -L 3 0 E 
Alt 0 RS AS y E y ln 
2.2.3 pe. 01.0 
os DR C,'=C,-C 1.0.0 
01 0 acsJo 1 06360 1.0 
0.0.0 0.0.0 00.0 


Luego rang(A) = rang(L2) = 2. Podemos ver que la última fila de A es suma de las dos primeras, por eso el rango es 2. 


7 Inversa de una matriz 


Decimos que una matriz cuadrada A € M,,(K) es regular si existe otra matriz denominada matriz inversa, A7! , tal que se 
cumple que A- 47! = 47! . A = /,, Tenemos las siguientes proposiciones: 


e Si la matriz A es regular su inversaA7? es también regular siendo su inversa A(A71)7! = 4; 
e Si una matriz A es regular la inversa 47? es única. 


e Si A,B son matrices regulares entonces A - B es otra matriz regular siendo la inversa B7* . A7!*, Demostración: 
(A-B)-(B2.472)=A-(B-B"*).A71=A-1, A? =A- A?! =1,,, de manera análoga (B"* . 471) . (A - B). 
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e A es regular si y sólo si su aplicación asociada es automorfismo. De aquí se deduce que una matriz es regular y solo si sus 
columnas son linealmente independientes, ya que en los automorfismos f(u1),..., f(u,) son linealmente independientes 
al ser base, luego las filas de la matriz asociada que es una matriz regular son también independientes. Cualquier matriz 
regular de rango n es equivalente a /,,. 


7.1 Cálculo de la inversa 


Para calcular la inversa hay que tener en cuenta que las operaciones fila es equivalente a multiplicar por la izquierda por una 
matriz que realice esa operación. Si transformamos la matriz A en la matriz Identidad con operaciones fila es equivalente a 
multiplicar 47! por A. Para saber cuánto vale A7? podemos hacer las mismas operaciones a la matriz Id, que se transformará 
en A7!. Id que es A”! y así conoceremos esta matriz. Ejemplo: 


a AD (1 PANA 1 0 1-1 
o 1) “Lo NA 0: T0.1 
O O 


—— 
A ld ld A? 


8 Aplicaciones de las matrices 


Como comentamos en la introducción la matrices tienen muy diversas aplicaciones que van desde la discusión y resolución 
de los sistemas lineales a codificación de imágenes en ordenadores. Aquí solamente comentaremos alguna de las aplicaciones: 


8.1 Geometría 


Como ya hemos señalado, las matrices son una forma de codificar las aplicaciones lineales. Así, por ejemplo, la simetría con 
respecto y = x, f(x, y) = (y, 1) puede representarse mediante la matriz : 


o el giro de ángulo a: respecto a OX mediante: 
f (y) = (Sena cosa ) (y) 


Otra aplicación geométrica es el estudio de la posición relativa de planos y rectas, para esto se utiliza el rango de las 
matrices de los coeficientes y de la ampliada. 


8.2 Discusión y resolución de sistemas lineales de ecuaciones 


Un sistema de ecuaciones lineales puede representarse usando matrices mediante 
Ar=b 


donde A es la matriz de coeficientes del sistema, x el vector columna formado por las incógnitas y b es el vector columna 
formado por los términos independientes. El concepto de rango permite la discusión (ver si es resoluble y cuál es la dimensión 
del espacio de soluciones) y el método del pivote (Gauss) su resolución analítica. Otra forma de resolución (Cramer) utiliza 
el concepto de determinante de una matriz que se desarrolla en el tema 19. Si la matriz de coeficientes es regular, también 
se podría resolver usando su matriz inversa y la solución sería x= A7!b, aunque en la práctica este método no se utiliza ya 
que el cálculo de la inversa conlleva un mayor número de operaciones que su resolución por uno de los métodos anteriores 
(Gauss o Cramer). 


8.3 Programación lineal y grafos 


La mayoría de los problemas de programación lineal se formulan usando ecuaciones matriciales y muchos métodos de resolución 
como, por ejemplo, el método simplex, se basan en algoritmos aplicados a matrices numéricas. También en la teoría de grafos 
es fundamental el uso de matrices de conexión o de distancia de los distintos vértices del grafo. Se usan tanto matrices de 
incidencia como de adyacentes. Estos se usan por ejemplo par representar redes de carreteras o problemas de tráfico aéreo. 
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8.4 Probabilidad y estadística 


También en la estadística las matrices son fundamentales, por ejemplo, cuando en estadística descriptiva se representan los 
datos (o variables) medidos para diversos individuos. En este sentido, las hojas de cálculo también pueden considerarse como 
matrices cuando se eliminen las columnas que no sean numéricas. 

También se usan matrices de datos para presentar información como la matriz de desviaciones, matriz de varianza- 
covarianza, matriz de correlaciones... 


8.5 Física 


Las matrices encuentran aplicaciones fundamentales en la física en prácticamente todas sus áreas. Por ejemplo, en mecánica 
clásica, se utilizan para resolver sistemas de ecuaciones diferenciales que modelan el movimiento de partículas en campos 
vectoriales, mientras que en la mecánica cuántica, son esenciales para describir operadores lineales que representan observables 
físicos, como la energía y el momento angular de las partículas subatómicas. 


8.6 Economía 


La mayoría de los modelos económicos que tratan de modelar el comportamiento de un mercado provienen de la Teoría 
de Juegos y se construyen usando matrices numéricas. Un ejemplo son los modelos de Leontiev basados en las matrices 
input-output que le valieron el premio nobel de Economía. 


8.7 Informática 


Las matrices son fundamentales en muchas de las aplicaciones de la informática. Desde lo más simple que podría ser la 
codificación de teclado y pantallas como matrices, la pantalla se representa como una matriz de píxeles. 

Las imágenes se representan mediante matrices así que la tarjeta gráfica básicamente está operando con matrices continuamente 
para generar los gráficos de los juegos. En juegos en 3D las figuras estarán representadas por matrices y se aplicarán las 
operaciones de rotación, traslación, etc; que conocemos. O en aplicación de filtros en imágenes, muy populares en app 
actuales, son operaciones de matrices. De hecho hay procesadores específicos (GPU) especializados en gráficos, y por lo tanto 
Operaciones con matrices. 

Todo lo que tiene que ver con reconocimiento de patrones (voz, imagen, reconocimiento facial, etc...) también se basa 
en representación y operaciones matriciales. Un ejemplo concreto podría ser la aplicación Shazam de reconocimiento de 
canciones que usa matrices de frecuencias. 

En el área de la supercomputación se estudia cómo mejorar el algoritmo de transposición y multiplicación de matrices ya 
que es esencial en las aplicaciones desarrolladas y por tanto debe mejorarse su eficiencia computacional. Además también se 
usa tanto la transposición como la multiplicación de matrices para evaluar el rendimiento de nuevas propuestas tecnológicas 
en el área de los sistemas de tiempo real. 

Por último, aunque seguro que faltan muchas más aplicaciones, el desarrollo de la inteligencia artificial se basa en redes 
neuronales, que a su vez están basadas en operaciones matriciales. 


9 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y 
las características de la evaluación de la ESO y Bachiller. El estudio de las matrices de manera explícita se da en 2% de 
Bachillerato en las dos ramas, al igual que su aplicación a la resolución de sistemas de ecuaciones lineales. También se usan 
para estudiar la posición relativa de planos y rectas. 

Sin embargo debemos destacar que a través de la estadística el alumnado ya ha tenido un breve contacto con la 
representación matricial. 
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1 Introducción 


Una vez efectuado el estudio de las matrices (tema 18) estamos en condiciones de llevar a cabo el desarrollo de la teoría 
determinantes puesto que a lo largo de este tema veremos el concepto de determinante asociado, de forma única, al de la 
matriz cuadrada. 

Curiosamente el concepto de determinante surge antes que el de matriz, en aras de resolver e interpretar las solucione 
de sistemas de ecuaciones lineales. Se puede considerar a Cramer (mediados siglo XVIII) como el matemático principal que 
calculó los determinantes para cualquier dimensión si bien hay que recordar también a matemáticos predecesores a él como 
Leibnitz y el japonés Kowa Seki que en el siglo anterior parece ser que calcularon determinantes de orden 3 y 4. 

Sabemos que el estudio de los determinantes puede realizarse también a través de las aplicaciones multilineales, pero no 
será éste el enfoque que daremos a nuestro desarrollo por considerarlo, actualmente, poco utilizado en el nivel de nuestros 
alumnos de enseñanza secundaria. 


2 Definición y propiedades 


Sea A = (a;¿) matriz cuadrada de orden n (i,j = 1,..,n). Se llama determinante de A y se denota det(A) o |4], al número 
real suma de los n! productos de n elementos formados de la siguiente manera: en cada producto entra un único elemento 
de cada fila y un único elemento de cada columna,cada producto se multiplica por (+1) o (—1) según la paridad de las 
permutaciones. 

Suponemos conocidos los contenidos básicos de combinatoria y solo recordamos aquí algunas nociones relacionadas con las 
permutaciones: Sean ([a,,.., a, , n elementos cualesquiera y tomamos la permutación a1,..., 4, como la principal; entonces 
dos elementos se dice que sufren una inversión si prescindiendo de los demás se encuentran en sentido contrario a como lo 
hacen en la principal, si no se dice que presentan permanencia. Se dice que una permutación (p) es de clase par o impar 
según sea par o impar el número total de inversiones que presenta. Por ejemplo (az, az, a, + posee una inversión en los lugares 
1 y 3, y otra en los lugares 2 y 3, es por tanto par. Se denota índice de la permutación p, I(p) = 2. 

Se llama paridad o signatura de p se denota como e(p) = (—1)'(P). En el caso anterior, e(p) = (-1)? = +1. Si 1(p) es 
impar, entonces e(p) = —1. 


2.1 Determinantes de 2% y 32 orden 


El determinante de 29 orden es el determinante de una matriz cuadrada de orden 2 A = (42! 42) y aplicando la definición 


obtenemos que |A| = a11 - 422 — 412 : 421, puesto que la permutación identidad (1,2) es par y (2,1) es impar. Nos fijamos en 
el segundo índice con los términos de los productos ordenados según el primer índice. 
411 412 013 


El determinante de 32 orden es el determinante de una matriz cuadrada de orden 3 A = (a 422 a23 ) y aplicando la 
31 32 433 


definición obtenemos que Al = 411 : 422: 433 + 012 * 023 : Q31 + 013 * 091 : 432 — 013 : 022 : 031 — 012 * 091 * 433 — 011 : 093 * 0432» 
puesto que en P3 hay tres permutaciones pares y tres impares. El determinante de orden 3 se suele simbolizar por la regla 
de Sarrus: 


31 32 3 


El cálculo de determinantes de orden superior a 3 es muy laborioso, veremos un método que permite reducir el cálculo 
de un determinante de orden p al de otros de orden p— 1 y así sucesivamente hasta reducirlo al cálculo de determinantes de 
orden 3 y 2. 


2.2 Propiedades de los determinantes 


Debido a su definición tenemos: 


e |A4| =|4*|, Siendo A* la matriz transpuesta de A que se calcula cambiando las filas de A por sus columnas. Se demuestra 
cambiando los índices en la definición. 


e Al permutar dos filas (o dos columnas) en una matriz cuadrada, su determinante solo cambia de signo. Se demuestra 
ya que al permutar dos filas o dos columnas todas las permutaciones que se obtienen cambian de paridad, por lo que 
saldrá un factor -1 en todas las sumas. 
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e Si una matriz cuadrada tiene dos filas o dos columnas iguales, entonces su determinante es 0. Para demostrarlo podemos 
ver que si las intercambiamos, obtenemos la misma matriz pero a la vez por la propiedad anterior |4] = —|A4| > 2/4] 
0=>|4|=0 


e Si todos los elementos de una fila o columna de una matriz cuadrada son O entonces |4| = 0. Se demuestra ya que 
todos los productos contienen algún elemento que es O resultando en 0 y por lo tanto su suma. 


e Si todos los elementos de una fila o columna de un determinante contienen un factor común puede sacarse fuera del 
determinante. Se demuestra ya que ese factor está en todos los productos de la suma. Corolario: para multiplicar un 
determinante por un número K basta con multiplicar una de sus filas o columnas por dicho número. 


e Una matriz cuadrada con dos filas o columnas proporcionales tiene determinante 0. Se demuestra si aplicamos la 
propiedad de igualdad y del factor común. 


e Si los elementos de cualquier fila o columna de una matriz cuadrada son sumas de igual número de términos (siempre 
se consigue añadiendo ceros), entonces su determinante asociado es la suma de tantos determinantes como sumandos 
figuren en la fila o columna, en los que todas las filas o columnas permanecen inalteradas salvo la formada por sumandos, 
que será reemplazada por el primer sumando para el primer determinante, por el segundo sumando para el segundo 
y así sucesivamente. Se demuestra por la propiedad distributiva de la suma respecto del producto. Como ejemplo, 
determinante de orden 3 con 2 sumando en la segunda fila: 

411 a12 013 


A = | az +b21 a22+b22 023 +b23 
Q31 q32 033 


411 412 413 
ba1 b22 b23 
a31 0432 033 


411 412 013 
421 422 423 
031 0432 033 


+ 


e Sia los elementos de una fila (o columna) se le suma una combinación lineal de algunas otras filas (o columnas), el 
valor del determinante no varía. Este resultado es muy útil ya que puede conseguirse que en algunas filas (o columnas) 
aparezcan ceros, lo que simplificará el desarrollo del determinante. Para demostrarlo se aplica la propiedad anterior y 
luego la de la proporcionalidad. 


2.3 Definiciones de menor complementario y adjunto de un elemento 


Dada una matriz cuadrada de orden n, se llama menor complementario del elemento a;¿, al determinante de la matriz de orden 
n — 1 que se obtiene al suprimir la fila ¿ y la columnas ¿ (C;¿). Se denomina adjunto del elemento a; a Aj; = (-1D)9W]C;5!. 


a O E 
WIN Y 
e E (Ar "A 0 | =4 
0. 0 $ 
NS ES 
E CS A 


La matriz adjunta adj(A) es aquella en la que cada elemento se sustituye por su adjunto. Esta matriz cumple la siguiente 
propiedad: 
A-adj(A)' =adj(A)Y - A=]|A| - L,, 


Podemos enunciar a continuación una serie de teoremas de suma importancia en el desarrollo de la teoría de los 
determinantes: 


e Desarrollo de un determinante: El determinante de una matriz cuadrada es igual a la suma de los elementos de una 
fila o columna cualquiera, multiplicados por sus adjuntos. 


14] =Y aj: Aj, 1<i<n 


n 
14] = Y aj Aj LE GEN 
¿i=1 
— La suma de los productos de los elementos de una fila (o columna) por los adjuntos de otra es 0. 


j=1 


Sas E Ask = 0,V3 A k 
i=1 
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— El determinante de una matriz triangular es el producto de los elementos de la diagonal. 


e Determinante del producto de dos matrices: Si A y B matrices cuadradas de orden n, entonces 
¡A- Bl =]4] -|B] 


Usando este resultado es fácil caracterizar las matrices no singulares (no invertibles), así como obtener una regla práctica 
para el cálculo de la matriz inversa. 


3 Cálculo práctico de determinantes de orden elevado 


Podemos calcular los determinantes de tamaño grande (mayor o igual que 4) aplicando la definición de determinante (pero 
tendremos n! elementos) o desarrollar el determinante por adjuntos ( si es de orden 4 hacer 4 determinantes de orden 3). 
Cualquiera de estos dos procedimientos por sí solo es muy laborioso, y prácticamente inabordable para n > 4. 

Así que en realidad vamos a usar el desarrollo por adjuntos pero para simplificar este cálculo se aplicará la propiedad 
anteriormente citada sobre la invariabilidad del determinante al sumar a una fila (o columna) una combinación lineal de 
algunas otras filas (o columnas). Esta propiedad nos permite transformar una fila (o columna) de manera que contenga un 
elemento igual a 1 y el resto sean igual a 0, lo cual reduce el sumatorio del desarrollo del determinante a un solo término. 

Aunque el método es general vamos a usar como ejemplo un determinante de orden 4: 


021 422 423 424 
431 432 0433 034 
041 0442 043 044 


lA] = 


411 412 413 A14 | 


Escogemos como elemento ”pivote” aquel que tenga valor 1, en el caso de que no existiera se toma cualquier elemento distinto 

de cero y se divide la fila (o columna) por el mismo, sacándolo como factor común. Suponemos entonces az3 = 1 y aplicamos 

las siguiente transformaciones: Fila; = Fila; —a13: Filas, Filaz = Filaz—a33: Filas, Fila, = Fila, — 043: Filas, obteniendo: 

411013021 412413022 0 414— 013024 
a21 0422 1 024 


431—033421 432— 033022 Ú 434—433024 
441443421 442—043422 O 044—043024 


lA] = 


Los elementos de las filas 1,3, 4 de la tercera columna se anulan ya que, por ejemplo, az = az — 4jz423, y COMO 493 = 1 
entonces az =0 con ¿ =1,3,4. Aplicando el desarrollo del determinantes por la tercera columna tenemos: 


411413021 412 013022 414— 013024 
a21 422 024 
431—433021 432— 033022 034—033024 
441443421 442043022 A44— 043024 


ALO Ajs +1: Ao9 PlAss +0 Al > (AMA 


El determinante resultante es de orden 3 que podríamos resolver ya directamente o incluso podríamos volver a aplicar este 
mismo método para reducirlo a orden 2 y simplificar su cálculo todavía más. 


4 Determinante de Vandermonde 


Un determinante muy importante y que sale bastantes veces (por ejemplo en interpolación polinómica) es el denominado 
determinante de Vandermonde (Matemático Francés del siglo XVII). La matriz de Vandermonde es una matriz que tiene 
una progresión lineal en cada fila o columna. Su determinante se llama determinante de Vandermonde siendo su resultado: 


En la imagen hay una errata el producto es de aj — as. Demostración: para demostrar la proposición aplicamos el cálculo 
de determinante visto en el apartado anterior haciendo ceros con el elemento a: la primera columna: 
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1 1 l Ae l 
0 a,-4; a,-4, des a,-4; 
det(V,) =|0  a,(a,-a)  as(a,-a) .. a,(a,—-a)|=(a,-a,)..(a, —a,)det(V,_,) 

0 a*Y(a,-a) a *(a,-a) .. a *(a,-a,) 
1 1 1 1 1 1 1 
a, 3 5 4,4, 0... a, 74) 

det(V, ) = (a, —a,):...(a, —a,) = (a, -a,)...(a, —-a,) i = 
E O aaa (aa 


= (a, —a,)...(a, —a,) (a, —a,)...(a, —a,) det(V,_,) 
Repitiendo el procedimiento n-1 veces llegaremos la expresión inicial. 


5 Aplicaciones de los determinantes 


Entre las muchas aplicaciones podemos citar: 
e Cálculo de la matriz inversa de una matriz regular 
e Estudio de la dependencia lineal de vectores 
e Cálculo del rango de una matriz. A su vez el cálculo del rango se emplea para: 


— Resolución de sistemas de ecuaciones 
— El estudio de la geometría del plano y del espacio 


No obstante, tales cuestiones pueden resolverse sin hacer uso de los determinantes, aplicando el cálculo matricial, pero vamos 
a poner de manifiesto el gran instrumento de trabajo que son los determinantes a la hora de efectuar tales cálculos. Si bien, 
vamos a cenirnos en este tema a desarrollar lo relativo a las tres primeras aplicaciones debido a las limitaciones en tiempo y 
que las otras aplicaciones pertenecen al dominio de otros temas de este mismo temario. 


5.1 Cálculo de la matriz inversa 


Una matriz A € M,, (IR) es regular si tiene inversa, es decir existe A7* tal que A- 47! = [,,. 
Teorema: Una matriz A € M,, tiene inversa si y solo si |A| 4 0 
Para demostrarlo tomaremos A tiene inversa 


SA TÍA 1, 8 A AS |A]- [47] =1=3 14 40A]4 740 


Por otro lado si suponemos que el |4]| 4 0 y supongamos que si existe inversa es 47! = TA - adj(A)*, por la propiedad de 
la matriz adjunta y las propiedades del producto de matrices: 
dl 1 1 
A- (q edilAJ) = q (A adj(AJ) = GA: Ln = La 
|A| Al A] 
A 
— -(Q Y) , = — (a Y] A =—. *ln= ln 
Al Al A] 
Por lo tanto, A”! existe y es A7! = A -adj(A)', la obtención de la matriz inversa con este método se denomina método 


de adjuntos. 


3 4 
Ejemplo: Sea A -[; , calcular A*: Como |A| = 2 % 0 ya sabemos que existe A”: 
An As, 2 -4 ; > 
ANS [Al [A] 5 os 70 E 3 
As. 25% -1 3 En a 


Aj (Ap) ñ2 2 
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5.2 Estudio de la dependencia lineal de vectores 


Vamos a enunciar los dos resultados fundamentales que relacionan el estudio de la dependencia lineal de vectores con los 
determinantes: 


n n 
e Sean 01,..., Un N vectores de R” y w = ) k;-v; con k;, €R,1<1< mn, entonces |01,...., Ww, ..., Un] = DI k;+]U1, ..., Vi, -»-, Un| 
¿=1 ¿=1 


e Dados n vectores 01,..., Un € R” son linealmente independientes si y solo si |v,...,un| 4 0. 


Ejemplo: u = (4,2,0);v = (1,0,2);w = (-1,0,—1) 
41-1 
lu, v,w| = 290, =-1%0 


=>> u, uv, w son linealmente independientes. 


5.3 Cálculo del rango de una matriz 


Para entender el concepto de rango, tenemos que recordar la relación entre las matrices y las aplicaciones lineales entre 
espacios vectoriales. 

Proposición: podemos establecer una relación isomorfa entre las matrices Mm xn(K) y el conjunto de aplicaciones lineales 
entre los K-espacios vectoriales V y W, con dim(V) = mM y dim(W) = m. Esto nos permite poner toda aplicación lineal como 
una matriz y al revés. 

Llamaremos rango de una matriz A, rang(A), a a la dimensión del espacio imagen de la aplicación f asociada, es decir 
rang(A) = dim(Im(f)). Se cumple por tanto que el rango de una matriz es el número de columnas (vectores imagen de f) 
linealmente independientes. Por lo tanto, el rango de una matriz A € Minxn(K) es menor o igual al número de filas, m, y al 
número de columnas, n. Es decir rang(A) < min(m, n). 

Se denomina menor de orden h de la matriz A al determinante de la submatriz que se obtiene al suprimir m — h filas y 
n — h columnas de la matriz A. 

Y se llama menor principal de orden h a todo menor no nulo de orden h de una matriz A. 

Se llama rango h de la matriz A, rg(A) = h si existe, al menos, un menor de orden A distinto de cero, siendo nulos todos 
los menores posibles de orden superior h. 

De estas definiciones se extraen las siguientes consecuencias: 


e Si en A se intercambian entre sí dos filas (o columnas) 1, j se obtiene otra matriz A” de igual rango que A 


e Si una fila (o columna) de A está formada por ceros, el rango de A es igual al de la matriz resultante al eliminar esa 
fila o columna. 


El rango de la matriz nula es 0 y es la única cuyo rango es O 
e Para toda matriz de orden n con |4| 40 rg(A) =n 
e Teorema: El rango de una matriz coincide con el número de sus filas o columnas linealmente independientes. 


Sea A una matriz m x n, supongamos que se encuentra un menor de orden h % 0. Para determinar si el rg(A) = h se han 
de estudiar todos los menores de A de orden p con h < p < min(m,n). 

Si se anulan todos los menores de orden p fijo de A, se anulan todos los de orden q con q > p. Por lo tanto, bastará 
comprobar que son nulos lo de orden h + 1. De aquí obtenemos la siguiente regla: Sea q un menor no nulo de orden h. 
Añadimos a este menor una fila y cada una de las columnas que no están en «a (a esto se le denomina orlar a a: con estas fila 
y columnas). Si obtenemos que todos los determinantes son cero entonces la fila es combinación lineal de las h filas de a: y se 
puedes prescindir de ella. Análogamente con las demás filas, si son cero los determinantes de todas ellas, entonces solo tiene 
las h filas independientes de a y el rango es h. Si no son nulos todos los determinantes, se procede con el no cero como a y 
se repite el procedimiento. 
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2.0.0 0 

0000 
Ejemplo: Calcular el rango de la matriz siguiente: A = 

0030 

00.00 


|A]=0 (luego no es de rango 4) 
Veamos que todos los menores de orden 3 son cero: 


200 200 200 2.00 200 
0 0 0=0/0 O 3=0 
0.03 000 0.30 0.00 000 


o 
[e] 
1 
o 
o 
UY 
[=) 
1 
o 
o 
o 
[=) 
I 
o 


200 200 0.00 0 0 0-00 
0 0 0)=0 [0 O O/=0 [0 0)=0 [O 3 0O/=0 [0 0 0|=0,etc. 
0.00 000 030 0 0 000 


Sin embargo, 


] =6%0, es un menor de orden 2 distinto de cero, luego es un menor 


principal de orden 2. Luego Rang(A)=2 


5.4 Resolución de sistemas de ecuaciones 


Como hemos visto los determinantes facilitan enormemente el cálculo de rangos de matrices que a su vez son usados en la 
resolución de sistemas de ecuaciones. 
Sea el sistema general de m ecuaciones lineales con n incógnitas: 


0111 PF. + An DA bi 


Am1T1 +... + Amn Tn = Dm 


Siendo A matriz de coeficientes a;; y Ax matriz ampliada añadiendo a A la columna de términos independientes. Una vez 
calculado rg(A) = r, para calcular el rg(Ax) hay que orlar el menor principal «. con la columna de términos independientes 


b; y cada una de las m — r filas que no figuran en él. 
aii. er di 


Se obtienen así determinantes de la forma 


E (1=r+1,,...,m); siendo estos los determinantes característicos. 

ati --- Qin Ol 

e Teorema de Kronecker-Capelli: Siendo A matriz de coeficientes aj¿ y A+ matriz ampliada añadiendo a A la columna 
de términos independientes.Es compatible si, y solo si, el rango de la matriz ampliada Ax es igual al rango de la matriz 
de coeficientes A. 


e Teorema de Rouché-Frobenius:Si un sistema lineal de ecuaciones es compatible, y el rango de A es igual al número de 
incógnitas, la solución es única. Si el rango de A es menor que el número de incógnitas, hay infinitas soluciones, cada 
una de las cuales se obtiene dando un sistema de valores arbitrarios a las incógnitas no principales 


6 Aspectos didácticos 


Son en las órdenes ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y 
las características de la evaluación de la ESO y Bachiller. El estudio de las matrices de manera explícita se da en 2% de 
Bachillerato en las dos ramas, al igual que su aplicación a la resolución de sistemas de ecuaciones lineales. También se usan 
para estudiar la posición relativa de planos y rectas. 
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1 Introducción y desarrollo histórico de la noción de función 


En el siglo XIV surge la noción actual de función; existía la preocupación de medir y representar gráficamente las variaciones 
de ciertas magnitudes. El primero que le dio un apoyo gráfico fue Nicolas de Oresme. La información relativa a un cierto 
fenómeno permite describir el comportamiento de otro. 

Leibniz y los hermanos Bernouilli solo hablan de funciones particulares; como potencias, funciones circulares y otras, pero 
sin pararse a pensar en el concepto en sí. 

Euler introduce el símbolo f(x): <Una función de una variable x es una expresión analítica construido de alguna manera 
a partir de esta variable x y de números o cantidades constantes>. También habla de funciones referidas a un sistema de ejes 
coordenados y comprobó que la relación se da trazada en una curva cualquiera. Lagrange hizo contribuciones significativas 
al estudio de las funciones analíticas y su teoría, especialmente en lo que respecta a la representación de estas funciones 
mediante series de potencias. 

Dirichlet aporta la siguiente definición: <Si a todo x le corresponde una única y (finita) en un intervalo entonces y es una 
función de x en este intervalo> La definición de forma general era: «y es función de x si a cada elemento de un conjunto 
de cosas X corresponde un único elemento de otro conjunto de cosas Y >. Pero se define más rigurosamente de la siguiente 
forma: < Una función definida entre dos conjuntos A y B es un subconjunto del producto cartesiano de A y B en el que 
cada elemento de A aparece una única vez>. 

Se puede ampliar el concepto de función, por ejemplo, cuando aparezca y = yz (función multivaluada) y otras de este 
tipo, hay que tener cuidado ya que en estas nuevas definiciones un valor determinado de zx le corresponden varios (incluso 
infinitos) de y, lo cual contradice la definición de función. Por lo tanto, por ejemplo, una función será una función mutivaluada 
pero una multivaluada no será función. 

En el s.XIX se estudia cómo se podían sumar, restar y hacer otras operaciones con funciones. Se descubre la posibilidad 
de mirar una función como un simple elemento de una estructura más complicada, hay deseo de conocer la estructura de 
estos espacios o conjuntos de funciones. Así nace el análisis funcional. 


2 Consideraciones generales sobre las funciones reales de variable real 


2.1 La recta real 


A cada punto de la recta de R, elegido un origen y un segmento unidad le corresponde un sólo número real. Todo número 
real puede ser representado mediante un solo punto de la recta. Identificaremos el conjunto R de los números reales y los 
puntos de la recta ¡R, llamada recta real. 

LLamaremos intervalo cerrado de extremos a,b (con a < b) de la recta real a los x tal que a < x < db y se denota [a, b]. 
De la misma forma, llamaremos intervalo abierto de extremos a,b (con a < b) de la recta real a los x tal que a < x < b y se 
denota (a,b). E intervalo semiabierto de extremos a,b (con a < b) de la recta real a los x tal quea<x<boa<ux<b y se 
denota [a,b) o (a, b], respectivamente. Si a = b el intervalo cerrado es un punto y el abierto el conjunto vacío, (). 


2.2 Función real de variable real 


Sea D un subconjunto no vacío de los número reales ¡R. Se llama función real de variable real a todo correspondencia f que 
asocia a cada elemento x € D un único elemento y € R. Se denota f: D >R y f(z) = y siendo y la variable dependiente 
de la variable (independiente) x. Para la determinación de una función se necesita: 


e Definir el conjunto inicial D 

e Definir el conjunto final, en el caso de funciones reales R. 

e Establecer la regla que permite asociar a cada elemento del conjunto inicial un único elemento del conjunto final. 

Una función está definida en un intervalo si a cualquier valor x € [a,b] corresponde un valor f(x) € R y se dice que la 
función f está definida en el intervalo [a, b]. Si el intervalo es todo R, la función está definida en todo el campo real. 
2.3 Dominio y recorrido 


Sea la función real de variable real f: D >R, con DCR. 
El dominio de definición de la función, Dom(f) , es el mayor subconjunto de R para los que la función f está definida, es 
decir: 


Dom(f) = (u E R|9y = f(=) € R) 


El recorrido o imagen de una función, f(D) o Imf, es el conjunto de todos valores de la variable dependiente (y = f(x)) 
que tienen algún valor de la variable independiente que se transforma en él por la función, es decir: 


FD) =Imf = [y € RlJz € Dom(f) con f(x) = y) 
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Según la relación entre su dominio y su imagen las funciones se pueden clasificar como: 


e Inyectiva: cuando no hay dos elementos del dominio que tengan la misma imagen, es decir 


Va,b € Dom(f), f(a) = F(0) >a=b 


e Sobreyectiva o suprayectiva: cuando cada elemento de R es la imagen de como mínimo un elemento de D, es decir, 


Vy ER, 3x1 € D|f(x) = y 


e Biyectiva: cuando es simultáneamente inyectiva y sobreyectiva, es decir todos los elementos del conjunto D tienen una 
imagen distinta de R y a cada elemento de R le corresponde un elemento de D: 


Vy ER, 3lx E D|f(1) = y 


En el caso de las funciones reales con variable real la función será biyectiva si y solo si Dom(f) = Imf =R. 


2.4 Representación de funciones 


Una función puede venir dada en forma de tabla (con todos los valores de D y sus imágenes correspondientes), expresión 
analítica (que establezca la relación entre los x € D y sus imágenes) o por su gráfica: 

La función se representa mediante una gráfica sobre unos ejes coordenados. Al eje horizontal se le llama eje X o de abcisas 
y se sitúa sobre él la variable independiente. Al vertical, eje Y o de ordenadas, y se sitúa sobre él la variable dependiente. 
Hay que establecer una escala en cada uno de los ejes. 

Para construir la gráfica y = f(x) construimos una tabla de doble entrada donde se dan unos valores arbitrarios a x y se 
obtienen sus correspondientes imágenes. A cada pareja de valores obtenidos (to, yo) se le hace corresponder un punto (xo, Yo) 
del plano. La gráfica es el conjunto de puntos (x, f(x)) del plano obtenidos recorrer la variable x todos los valores posibles. 


3 Operaciones con funciones 
Sean f: D; >R y 9: Dz +R con D¡ N Da 4 (). Definimos las siguientes operaciones: 
e Lasuma f +9: DM Da >R, se define por (f + g)(1) = f(x) + g(z). 
e La diferencia f — g: Di N Dz —>R, se define por (f — g)(x) = f(x) — g(x). 
e De estas definiciones obtenemos la función cero, tal que 0(x) =0,Vzx. Su gráfica es el eje de abcisas. 
e También la función opuesta de f, (—f)(x) =—f(x), Vx, siendo la gráficas f y —f simétricas respecto del eje X. 
e El producto f - 9: D¡ M Dz —>R, se define por (f - gx) = f(x) - g(x). 
e El cociente f/g : D¡ ND2 —>R, se define por (f/g)l(a) = Fa)/gla) A Lalgla) = 0). 
e De estas definiciones obtenemos la función uno, tal que 1(1) = 1,Vx, recta paralela a una distancia 1 al eje de abcisas. 
e También la función inversa multiplicativa de f, $ (5) HOM F(u) 4 0, siendo este el dominio de inversión. 
e También se define el producto por un escalar, sean f : D >Ryae€R entonces a- f : D —>R con (a- fx) = 
a: f(x), Vx € D. 
3.1 Composición de funciones 


Sean las funciones reales de variable real: f: A>KReg: B —>R. Se define como función compuesta a una función real de 
variable real p que se obtiene aplicando primero la función f y posteriormente la función g: 


p=gof:C>R 


> (go fx) = g(f(z)) 


con C= (2 € Alf(x) € Bt, es decir, es preciso que Im(f) € Dom(g). 
Esta operación verifica la propiedades asociativa (ho g)o f =ho (go f). Para demostrarlo tenemos que (ho g)o f = 
(ho gV(f(x)) =h(g(f(x))) y por otro lado ho (go f) = h((go Plx)) = h(g(f(2))), ambas expresiones son iguales. 
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La composición también posee un elemento neutro que es la función identidad, 7(x) = x, VR, es decir cada número real 
se transforma en sí mismo. Su representación gráfica son todos aquellos puntos (x,x) de manera que constituyen la bisectriz 
del primer y tercer cuadrante del eje de coordenadas. 

A partir de la composición también se define la función recíproca de una función, f7!. También se le denomina inversa 
respecto a la composición pero puede dar lugar a confusión con la inversa multiplicativa. Dada la función f: D—>R, si f es 
inyectiva entonces 3f7* : F(D) —>R. La función recíproca f7! es la que al componer con f resulta en la función identidad: 


Plofla)= fo f(x) =1(0), vz 


De esta condición se puede deducir que Dom(f) = Im(f7*) A Dom(f7*) = Imf 


4 Funciones elementales: Situaciones reales en las que aparecen 


Las funciones elementales se clasifican según el siguiente cuadro en: 


CLASIFICACIÓN de las 


Constante: y=a 


FUNCIONES ELEMENTALES 


Lineal: y =ax 
Transforma sumas en sumas 
f(x+y) = f(x) + f(y) 


Afín: y=ax+b 
Polinómicas Es una traslación de la lineal 


=>" m1 IÓ 
yt +d | Cuadráticas: y=ax+bx+e 


y=X 
Ñ Pares yo 
Potenciales: z 
Impares A == 
y=x 
k 
Propor. Inversa: y=-— 
a E y o 
Algebraicas Racionales: Pa) 
Se obtienen por AS 0(x) 


combinaciones de la 

variable (x) mediante 
las operaciones 
elementales de: 


y AP) + 009 
R(x)-3/S(x) 


Valor absoluto: y = |x| = dx? 


Irracionales (con radicales): 


= SUMA/RESTA 
» PRODUCTO/DIVISIÓN 
= POTENCIACIÓN 


¡RADICACIÓN 
Definidas a Trozos | Escalonadas: y = E[x] 
Algunas con nombre propio 
FUNCIONES Mantisa: y = x— Elx] 
ELEMENTALES Función signo: y = sig (x) 
Exponencial: y=a' (0<a) 
Transforma sumas en productos 
f(+y) =1(0) f(y) 
Logarítmica: y=log,x (0<a) 
Transforma productos en sumas 
f(x y) =1(x) +1(y) 
y = sen x 
Trascendentes sen (x +y) = sen x con y + cos x sen y 


Se “obtienen” a partir de 
las funciones 
algebraicas mediante el 
proceso de la 
integración definida. 
Por ejemplo: 


lx= [ia 


Trigonométricas 
y = cos x 


Cos (x + y) = cos x cos y — sen x sen y 


y=tgx 


A 
y=sen Xx 
a Epia ll 
Inversas de las Trigonométricas < y =c0s "Xx 
=p ll 
y=tg x 


corcrcrscccre... 
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Las funciones elementales son útiles en multitud de ocasiones para representar fenómenos de la Naturaleza. Existen una 
gran cantidad de leyes físicas que vienen expresadas mediante ellas. Lo mismo sucede con muchos hechos que ocurren en 
las ciencias sociales y en la economía. Las fórmulas que dan el área, volumen y otros tipos de relaciones en las figuras 
geométricas son casos particularmente sencillos en los que aparecen estas funciones. Aquí estudiaremos las funciones 
elementales algebraicas ya que las trascendentes pertenecen a otros temas de este temario. 


4.1 Funciones polinómicas 


Se llama función polinómica a la función 
Ff:RITR 


Ta) FM +. +02” 


siendo ag, ...,d, ER yn EN. La potencia más alta de x con coeficiente distinto de cero se llama grado de f. 

Como casos particulares tenemos la función constante f(x) = ag, la función lineal f(x) = ax, la función afín f(x) = 
ax +9, la función cuadrática f(x) = azx? + a¡1 + ay o las funciones potenciales f(x) =x",n € N. Estudiemos algunas de 
ellas en mayor profundidad. 


4.1.1 Función afín 


Una función afín es una función polinómica de primer grado que no pasa por el origen de coordenadas, o sea, por el punto 
(0,0). Las funciones afines son rectas definidas por: 


Fa) =mx+n,m,nA0 


En el caso de m = 0 se denomina función constante (recta paralela al eje de abcisas) y en el de n = 0 función lineal (recta 
que pasa por el origen de coordenadas). 


m (Pendiente) 


n (Ordenada) 


FUNCIÓN AFÍN 


La constante m determina la pendiente de la recta, es decir, el número de unidades en el eje de ordenadas por cada unidad 
del eje de abcisas. Este cociente es contante y también se llama razón de proporcionalidad. Por ello, siendo « el ángulo que 
forma la recta con el eje de abcisas tenemos que tana = m. Sim > 0 la función es creciente y si m < 0 decreciente. Dos 
rectas con la misma pendiente son paralelas. 

La ordenada en el origen, es decir el punto donde la recta corta al eje de ordenadas, lo determina el término independiente 
n, siendo (0,n). Dos rectas con el mismo término independiente cortan al eje Y en el mismo punto, que será su punto de 
corte. 

Como ejemplo de situación real de función afín podemos tomar el recorrido de un móvil con respecto al tiempo que se 
mueve con velocidad uniforme (velocidad constante en función del tiempo). 

Una recta no siempre viene definida por la pendiente y la ordenada en el origen. Por ejemplo, con dado un punto de la 
recta P(xo, Yo) y su pendiente m la ecuación se expresa: 


y — Yo = M(1 — Lo) 
También puede definirse dados dos puntos que pertenezcan a la recta (Zo, Yo) y (11, y1), obteniendo la función: 


Yi — YO 
0 = - (2 
1 To 


y Zo) 

Las rectas verticales no son gráficas de ninguna función, y viceversa, puesto que a una variable le corresponderían más de 
una imagen, infinitas de hecho. Por lo tanto, si el conjunto de puntos del plano tiene la propiedad de que no haya dos puntos 
situados sobre la misma vertical podemos decir que dicho conjunto es la gráfica de una función. 
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4.1.2 Función cuadrática 


Función cuadrática o polinomio de 2” grado: 
f:RITR 


>ar+bo+<c 


con a,b,c € RAa HO ya que si a =0 sería la función afín. f(x) = ax? + bx +c es su forma estándar pero también podemos 
expresarla mediante su forma factorizada f(x) = a(xw — ri)(x — ra), donde r, y ra son las raíces de la función cuadrática. 


Eje de 


simetría 


—b 


e 


f(x)=au2+bx+c 


Vértice 
s _(—b -b? —4ac 
ús E 4a ) 


X 


Estas formas representan una parábola dónde a (común en todas ellas) indica la mayor o menor obertura de la curva. Es 
tanto más abierta cuanto menor es |a|, concavidad si a > 0 (se abre hacia arriba) y convexidad si a < 0 (se abre hacia abajo). 

También puede expresarse la función cuadrática en su forma del vértice f(x) = a(x — t,)? + Yy, donde x, y yy son las 
coordenadas del vértice (2,,Yy), y a sigue siendo común a las dos anteriores. 

Para determinar el vértice a partir de su forma estándar la igualamos a la forma del vértice y obtenemos: 


an?+ba+e = a(x—z.)+Y» > art+ba+c= ax*—2a1,12+4%y.+Yu > a=anxb = —2a1 MAL, +Yy =C> lo = — 


Si a > 0, el vértice será el punto mínimo de la parábola en y y si a < 0 será el punto máximo. A partir de aquí podemos 
clasificar las parábolas según su posición: 


e Sia<0 y yy <0, la parábola no corta al eje x. En este caso la función no podría factorizarse. 


e Sia<0 y yy =0, el vértice está en el eje x y es el único punto por dónde lo corta. 


Sia<0 y Yu > 0, la parábola corta el eje en dos puntos al eje x. 


Sia >0 y Yy > 0, la parábola no corta al eje x. En este caso la función no podría factorizarse. 


Si a >0 y yy =0, el vértice está en el eje x y es el único punto por dónde lo corta. 
e Sia>0 y yy < 0, la parábola corta el eje en dos puntos al eje z. 


Como caso particular de la función cuadrática tenemos cuando b= 0 y por tanto f(x) = ax? +c. Esta es una parábola 
cuyo vértice está en (0,c), es decir es simétrica respecto al eje y. Por otro lado si c = 0, la parábola pasa por el eje de 
coordenadas. 

Como ejemplo de fenómenos cuya representación es una función cuadrática tenemos el espacio recorrido por un móvil en 
un movimiento uniformemente acelerado en función del tiempo t. 


4.1.3 Potenciales 


Son funciones de la forma y = ax” con a €R y nEN. Cuando n es par, la función será par, es decir f(—x) = f(x), Vx, sin 
embargo cuando n sea impar, la función será impar f(-x) = — f(x), Vx. 
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Familia de funciones potenciales con 
exponente impar 


Familia de funciones potenciales 
con exponente par 


Un ejemplo de potencia cuarta es el poder emisivo del cuerpo negro que es proporcional a la cuarta potencia de la 
temperatura absoluta T.(Ley Stefan-Boltzman): 
ná OT? 


siendo 9 una constante (Mecánica cuántica). 


4.2 Funciones definidas a trozos 


Una función definida a trozos es aquella que se define con una expresión analítica diferente para distintos intervalos de su 
dominio. 


Expr, si Subconjunto; 


Expr, si Subconjunto, 
f)= : s 


Expr, si Subconjunto, 


Dónde Expr,, Expra, Expr,, son las fórmulas concretas con las que se obtiene el valor de la función f(x) (variable 
dependiente y). Se utiliza una u otra según la rama o intervalo del dominio en el que esté la variable independiente x. 
Y Subconjunto¡, Subconjuntoz, Subconjunto,, son los intervalos de números reales para los cuales está definida esa rama. 
Deben expresar un rango de valores disjuntos de la variable independiente x. Dicho de otra manera, un valor de x no puede 
estar en dos ramas distintas. 


Un ejemplo de situación real de función definida a trozos podría ser: Si posees el bono de Bizi Zaragoza la primera media 
hora de uso de la bici es gratis y las fracciones de 30 minutos siguientes (hasta llegar a las 2 horas que hay de límite) tendrán 
un coste de 0,5 euros. Si se excede de las 2 horas seguidas de uso hay una penalización de 3 euros por cada hora excedida. 


4.3 Funciones irracionales: con raíces 


La restricción de la función y = x? a los reales positivos I¡R+ es una biyección f : RY => R*, entonces, existe la función 


recíproca y = yx. Esta es una función creciente en R* y está acotada inferiormente, alcanzando su mínimo absoluto en 
(0,0). No está acotada superiormente. Es interesante por ser la inversa de la función cuadrática. 
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opa 


Un ejemplo es el periodo de un péndulo simple que es función raíz de la longitud : 


l 
r=m/: 
9 


4.4 Funciones racionales de proporcionalidad inversa 


g representa la aceleración debida a la gravedad. 


Estas funciones responden a la forma f(x) = E con k constante. Su representación gráfica es una hipérbola y no está definida 


en z=0. Si k > 0 la función es decreciente y su gráfica aparece en los cuadrantes 1% y 3%. Si k < 0 la función es creciente y 
su gráfica está en el 22 y 4 cuadrante. 


A 


A a ii 


Grafica/Propiedades | A | 


A 
Y= "+2 


x 
lxeRix+*-2) | (xERix +0) 


x=-2 


Son los fenómenos que ligan dos variables cuya relación es de proporcionalidad inversa, por ejemplo, la frecuencia de un 
sonido y su longitud de onda, la presión de un gas a temperatura constante respecto al volumen del recipiente que lo contiene. 


5 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. La materia correspondiente a este tema se estudia 
en todos los cursos de la ESO y en Matemáticas 1 y Matemáticas Aplicadas a las Ciencias Sociales I, en el sentido algebraico 
dentro de los saberes básicos, cada año profundizando y formalizando más su estudio. 

Su conexión con su representación gráfica nos permite trabajar especialmente la competencia específica número 5 de la 
ESO: Reconocer y utilizar conexiones entre los diferentes elementos matemáticos, interconectando conceptos y procedimientos, 
para desarrollar una visión de las matemáticas como un todo integrado. 
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1 Introducción histórica 


Las tablillas babilónicas de la antigiedad incluyen tablas que muestran las potencias sucesivas de ciertos números. A diferencia 
de las tablas modernas, estas no seguían un patrón sistemático utilizando una base fija y presentaban intervalos irregulares 
entre las entradas. 

Sin embargo fue ya en el siglo XVI, cuando ocurrió la invención real de los logaritmos, con el objetivo de simplificar 
cálculos aritméticos, sobre todo en el área de astronomía en las que se manejaban número de muchas cifras. 

El concepto, aunque no el nombre de logaritmo, aparece en la Arithmetica Integra de Muchael Stifiel, utilizándose antes 
que la exponenciación. Los logaritmos surgieron sobre todo debido a la exigencia práctica de los calculistas de la astronomía 
y la navegación y lo hicieron por obra de dos autores distintos y de forma independiente: el escocés John Napier (al que se 
debe el nombre) y el suizo Biirgi, que publican sus tablas a comienzos del siglo XVII con pocos años de diferencia. 

En este mismo siglo, el matemático inglés Henry Briggs visitó a John Napier. Durante esta visita, surgió la idea de 
utilizar 10 como base para los logaritmos. Después de la muerte de Napier, Briggs continuó la tarea de elaborar las tablas 
de logaritmos decimales y publicó el primer tratado sobre logaritmos, titulado ” Arithmetica Logarithmica”. 

Paralelamente, Speidell calculaba los logaritmos neperianos de las funciones trigonométricas publicándolos en su obra 
New Logarithmes. 

En este tema haremos un estudio detallado de las funciones inversas exponencial y logarítmica,que tienen una peculiaridad 
importante, una de ella es la inversa de la otra. 


2 Definición de función 


Una función real de variable real es una correspondencia o aplicación de un subconjunto no vacío D C R en R (lo escribiremos 
f: DR) que a cada elemento x € D le asocia un elemento y € R, y sólo uno. Las funciones se clasifican en algebraicas 
Y anx” y transcendentes (exponenciales, logarítmicas y trigonométricas). En este tema vamos a estudiar las exponenciales 
y logarítmicas. 

En este tema vamos a presentar primero una construcción de la función exponencial a partir de su definición con exponente 
natural, entero y racional para llegar a exponente real. Posteriormente definiremos independientemente la función exponencial 
de base ”e” y a partir de ella la función exponencial de base a > 0 y las funciones logarítmicas de base a > 0. 


3 Construcción de la función exponencial de base a 


Vamos a describir las aplicaciones de potencias de exponente natural, entero y racional. 


3.1 Potencias de exponente natural 


Sea un número a € R, que denominaremos base, definimos una aplicación f, q de (N, +) a (R, -) tal que: 
fa: N>R 


n> a” 


La definimos por inducción partiendo de f¿(0) =1 y fa(n) = a: fa(n—1). Cumpliendo las siguiente propiedades: f(1) = a 
y filn+m) = fa(n) - £,(m). Con esta última vemos que la aplicación es un homomorfismo que se mantendra en todas las 
ampliaciones. 


3.2 Potencias de exponente entero 


Vamos ahora a ampliar la aplicación anterior siendo el conjunto inicial los enteros, por lo que ahora será homomorfismo entre 
los grupos (Z,+) y (R*, -). 
fa: Z2 > Rx 


n>oa" 


definida de forma equivalente a la exponente natural si n € ZFU(f0) =N, y para los enteros negativos, Z7 descrito de la 
siguiente forma f¿(—n) = 1/f,(n) =1/a” =a7",n € N y —n opuesto de n. 

Vemos que cumple el homomorfismo pues transforma opuestos de (Z, +) en opuestos de (R*, -). 

Debido a que sia=0> fí—n) = or = 5» no se puede definir la función con a = 0. Esto implica también que la imagen 
de la función son los reales sin el 0 Rx. 
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3.3 Potencias de exponente racional 


Este último apartado previo a la definición de la función real se amplía de exponente entero a fraccionario. Así f, es 
homomorfismo entre (Q,+) y (R*, -). 


fa: Q — Rx 
r>a' 
donde r € Q y se expresará como la fracción irreducible r = +. Sim = 1 tendremos que r € Z y tendremos que la aplicación 


se comporta como vimos en el apartado anterior. 

Para ver como se comporta los r € Q que no son enteros definamos la aplicación para los racionales de la forma 1/m ya 
que para ver f.(n/m) aplicaremos que es homomorfismo y será f.(n/m) = (f,(1/m))”. Para el valor de f¿(1/m) aplicamos 
que es homomorfismo y fa(1) = fa(m/m) = (fa(1/m))” = a, luego se cumple: 


fa(1/m) = v/a 


Luego de forma general f, (n/m) = “Ya” 
En este caso si a < 0 no existe en los racionales f.(1/m) si m es par. Por lo tanto solo podrá definirse la función 
exponencial para bases mayores que 0. Esto implica también que la imagen de la función son los reales positivos ¡R+. 


3.4 Función exponencial real 


Recodemos que buscamos una función real continua con dominio en todo RR y que sea homomorfismo de grupos (R,+) en 
(R+, -), por tanto buscamos función que cumpla: 


e Función continua en R 
> F,(0) =1 
o filr+y)= falz)- faly) 


Veremos que hay tantas funciones exponenciales como posibles valores de a € ¡R+, denominada base y que por definición será 


fa) =a. 


4 Función exponencial de base <«e> 


Llamamos a la función exponencial de base e a la función E : R —>R* dada por: 


¡[e.el Jo 
E(2) = Y ASS 
n=0 
<e> es la suma de la serie numérica y + = E(1) = e. Este número se denomina ”e” en honor a Euler (nombrado por 
Napier) y se puede demostrar que e € 1 (irracionales) y que su valor es lim (14 Í)” =e = 2,7172... 
n—>00 


Proposición: Con esta definición es fácilmente comprobable que E(0) = 1 y que es un homomorfismo entre los grupos 
(R, +) Yi (R+, ele 
Propiedades: 


e E es continua al estar definida a partir de funciones continuas y definidas en R. 
e Ees derivable y E'(x) = E(x), Vx e R (derivando el sumatorio). 


e Ex) =e”, es decir E(x) es la función exponencial de base e que definimos anteriormente, ya que solo puede haber una 
función definida en R y con valores en R* que sea continua y verifique E(x+y) = Elx): E(y)Vx, y € R y con E(1) = e. 


e El-1)=0e"*=2. E(-2+2) = E(0) =1> Elx) - E(-2) = 1, luego E(-x) = e”? = PO) e 


e Función definida positiva e” > 0,Vx € R. Siz=0:e% =1>0. Six > 0: E(x) > 0 porque es una serie de potencias y 
por tanto cada término es positivo. Si x < 0, E(—x) =1/E(x), luego también es positivo. 
1 1 


A E E E rt ll 
m e”= lime *= lim ¿¿==0 


. . 00 ar . 
e lim e” =00 ( lim Zo 7 =00 li 
z>00 (lim, 2n=0 n! ) y L>=00 z=>00 L>00 


e Elu-y) =e "Y = (e%)1. 
e E(z) estrictamente creciente, como f'(x) =e” > 0,Vx € R. 


e La función e” crece más rápidamente que la función 2”, es decir, lim % =00. 
T—>00 
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5 La función logarítmica de base <«e> 


Por ser R => ¡R* continua y estrictamente creciente encontramos que es biyectiva y por tanto admite función inversa de 
R+ —> R estrictamente creciente y continua. 
Esta función se define como función logarítmica en base <e> o logaritmo neperiano y se denota LoLn: 


LIn:R*>R 
De modo que su relación con la función exponencial de base «<e>» es: 


In(1)=ySxvw=e? 


in(e”) = en) = e 


Veamos que esta nueva función cumple ser homomorfismo entre el grupo (R+, -) y el grupo (R, +), es decir a) In(x - y) = 
In(x) + In(y); b) In(1) = 0. Demostración: In(xy) = In(x) +In(y) => e(29) = ¿ntojtiniy) —, gay) = ell) ¿e y, y y = 
z-Y 

Aplicando las propiedades de su inversa E, Ln resulta con las siguientes propiedades: 

e In(1)=0 y En(e) =1 


e Lnr'(x) =,Vx e R*. Demostración: 


e Ln(1”) =n- Ln(<), Vx € R,Vn € N Demostración: En(x-....2)=Ln(1)+...+In(x) =n-In(x). (...: n veces) 


( 
( 

e Ln(x%)= 2. En(u), Vx € R,Vn € N 
( 


e Ln(5)= Ln() — Ln(y), Vx, y € R*. Demostración : 
in(x) 
In(e”/v) = Es a > ein) > In(e/y) =In(entm=m) En(2) = En(x) — En(y) 
PR y 


6 Función exponencial de base cualquiera a > 0 


Sea la función p : R —>R definida como p(x) = x - In(a), siendo a > 0. p es biyectiva, continua e infinitamente derivable de 
R en R (In(a) es una constante, es decir, p es lineal). 
Definición: Se define la función exponencial de base a como E, = Eop:R > R* dada por 


En(u) = Elpla)) = Ela -In(a)) = e '90 = (e1t0)% = a 
Aplicando las propiedades de E a la composición obtenemos: 
e In(a?) = x-In(a), Va € R* Demostración: In(a?) = In(e"1W0) = 2 - In(a) 
e a Y =a* -aY Vx, y € R,Va € R* 
e (a7)Y =a*Y Vx, y € R, Va € R+ 


ea =1,Va € R+ 


e al =a,Va Ec R*+ 


e Es continua para todo x en IR 


Es derivable y E/ (2) = E,(w) - In(a) = a” -In(a). Demostración: (ar = (ea) = golnta) . (2. In(a)/ =a* - In(a). 


e Sia > 1, es estrictamente creciente (In(a) > 0 > (a?) = a? - In(a) > 0); si 0 < a < 1 es estrictamente decreciente. 
(In(a) <0 > (a?) = a” - In(a) < 0) 
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7 Función Logarítmica de base cualquier a > 0 


Por ser £, : R > R* continua, biyectiva y estrictamente monótona Va > 0 y a 4 1 admite una función inversa L, : R+ > R 
continua y estrictamente monótona Va > 0 y aX 1. Sia > 1, L, será creciente si a < 1, decreciente. 

Definición: Se define la función logarítmica de base <a>, a > 0, a X 1 y se denota por L¿(x) o Loga(x) como la inversa 
de la función exponencial de base «<a>, es decir: 


Loga(1) =y > 1= aY 
loga(a?) = alval(2) = y 


Podemos enumerar las siguientes propiedades aplicando las de la inversa de E, que suponen en todas ellas x,y € R* y 
a,be RF (1P: 


e La función logarítmica de base <a> es un isomorfismo entre los grupos (IR*, -) y (R,+) 
e Loga() =logalu) — loga(y) 
e logw(x) = logy(a) - log,(x), como consecuencia se tiene la fórmula del cambio de base en el logaritmo: 


5 logy(x) 
logy(a) 


loga(x) 


Demostración:Para demostrar la regla del cambio de base de logaritmos, consideremos dos bases arbitrarias a y b con 
a,b>0,yajbAHl. 
y =loga(x),2 =logv(u) > z =b* = a* > log, (0*) = log,(a”) > 2 = y : log, (a) > log, (1) = log, (z) - log, (a) 


1 
logw(a) 


logo(b) 
logw(a) 


> loga(b) = > 


e log,(b) - logy(a) = 1. Demostración: aplicamos la regla anterior con x =b. loga(b) = 
loga(b) - logy(a) = 1 


e La función logarítmica de base <a> es derivable Vx € R* y además (log, (1) = z1q)- Demostración: usamos la regla 
del cambio de base. 4 ot d a , d 
n(u 
e cado! Ta da 
dx (log, (+) dx XMin(a) "da In(a) A In(a) zx 


8 Gráficas de las funciones exponencial y logarítmicas 


En virtud de todo lo anterior podemos representar gráficamente dichas funciones: 


8.1 Gráficas de la función exponencial 


Vamos a ver las gráficas de las funciones exponenciales según los valores de la base a € R+. Las gráficas se basan en las 
propiedades vistas anteriormente. Lo más importante es: 


1. Monotonía (si a>1 crece y si O<a<1 decrece) 
si a>1 lima =00; lim a* =0 
xD x—>-—0 


si O<a<1 lima”? =0; lima* =0w 


x>0 x>—0 


2. Tendencias: 


si a>1l mayor a mayores el crecimiento 
, x ? 
3. y'=aeIn(a): VxeR ] e 
si0<a<l menor sea a mayor es el decrecimiento 


X A Ñ 12 / / / 
(2/3) (YI A (1/3 t 3 / Fe Y 15 
MX l NX 6 / A 
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8.2 Gráficas de la función logarítmica 
Vamos a ver las gráficas de las funciones logarítmicas según los valores de la base a € R. Las gráficas se basan en las 


propiedades vistas anteriormente. Lo más importante es: 


Dominio es xe IR* 


1, 
2. Monotonía (si a>1 crece y si O<a<1 decrece) 
si a>1 limlog, (x)=0; lim log, (x) ==—00 
3. Tendencias: 4. 19 o 
si O<a<l1 limlog, (x) ==00; lim log, (x) = 00 
x>0 x>0* 
si a>1 mayor a menores el crecimiento 
4. y'=1/(xIn(a)): VxeR 3. o 
si0<a<1l menor sea a menor es el decrecimiento 
, Log2(x)__——- 
o A A 
Loga(x) 
Loga/3(X 
———————__—__——_ 


log1/e(X) 


log1/2(x) 


8.3 Función exponencial frente a la logarítmica 
Como la función exponencial es la inversa de la función logarítmica (o al revés) se cumple que las dos funciones son simétricas 


respecto a la función identidad y=x. Basta verlo en la siguiente tabla de valores. 


9 Situaciones reales en las que aparecen 
La función exponencial es un modelo válido para crecimientos continuos en los que las condiciones son siempre igualmente 


favorables. 


9.1 La desintegración atómica 


Ft con t el tiempo, N(x) número de átomos en el momento t = x y 


La fórmula de decaimiento radioactivo N(t) = N(0) - e 
k la constante de desintegración del elemento. En esto se basa la prueba del Carbono 14. 
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PA AS 


nl 
faja 


T T 
ur Un My ip  Sthyp 


tiempo 


El periodo de semidesintegración p se define como el tiempo en el que el número de átomos se reduce a la mitad: 


N 3 ] log2 
NO) =N(0)-e *P=1=2.e => 2=e' > In(2) =In(e*”) => p = a 


9.2 Cálculo de intereses 


Es la misma formula que la del problema del bosque: 


ct) =0(0)-(1+ 7) 


con t en años, c(x) capital al cabo de x años, e 1 el interés. 
Fórmulas similares pueden utilizarse para expresar la caída de un cuerpo en un medio resistente y el enfriamiento de un 


cuerpo. 


9.3 Crecimientos de poblaciones 


La función exponencial se usa para modelos de crecimientos de poblaciones, pero lo normal es que las poblaciones no crezcan 
sin límite y sin restricciones de su medioambiente. 
Cuando el hábitat impone limitaciones sobre el crecimiento es mejor usar el modelo logístico: 


Ym 


cl l+c:e7*t 


con t tiempo e Y, Cc, k constantes. Cuando t crece y tiende a Y;,m y cuando t = 0 yy = os que es más pequeño que Y, - 
Las propiedades cualitativas esenciales son que para valores pequeños de t recuerda a la función exponencial mientras que 
para los grandes se estabiliza aproximándose cada vez más a cierto límite. 


9.4 Función logarítmica 


La función logarítmica es menos utilizada que la función exponencial, si bien tiene gran interés a la hora de calcular las 
soluciones a expresiones exponenciales al ser la inversa de esta. 

Muchas magnitudes cuyo crecimiento es exponencial en base 10 se utiliza en su representación la escala logarítmica. 
En esta escala el crecimiento exponencial está representado presentado por una recta, siendo las medidas en esta escala 
denominada decibelios (db). Así una magnitud que aumenta en 2db implica que esta aumenta su magnitud en un factor 
10? : log¡0(2/x0) = 2db > x = 10? - xy Los ejemplos más conocidos que se miden en escala lo logarítmica es la medida del 
sonido o de los terremotos (escala Richert). 
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How the Richter Magnitude Scale 
is determined 


graph 


9.2 1964 Alaska 
earthquake 


p 
showing the largest amplitude of 
seismic waves 


3 
> 


wo 0L 


7.9 1906 San Francisco 


Seismograph | 
Al 
earthquake 


(Distance in Microns) 


6.9 1989 California 
earthquake 
5.7 2020 Salt Lake City 
earthquako 


Maximum Ground Motion Measured on Seism 


Most Earthquakes 
are Below 4 
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9.5 Cálculo de derivadas 
Una de las aplicaciones más importantes de los logaritmos es el cálculo de la derivada de las funciones de la forma «potencial- 
exponencial» 

eine 


Aplicando logaritmos resulta In(f(x)) = h(x) - In(g(x)). Derivando los dos miembros En =/h' (2) -In(gla)) +h(x)- yz) 
de donde multiplicando por f(x) obtenemos: 


10 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Podemos encontrar lo tratado en este tema en 
el sentido algebraico. En 32 ESO se introduce el modelo exponencial, concentrándose en las características de la función 
exponencial en 42ESO. Se puede introducir el modelo logarítmico en este curso aunque será en Bachiller cuando se profundice 
en ambas funciones. Entonces nos centraremos en las definiciones, propiedades y representaciones gráficas de estas funciones, 
sin entrar en su construcción, como hemos elaborado aquí, y en la resolución de ecuaciones exponenciales y logarítmicas. 

Las funciones exponenciales pueden ser utilizadas en la educación secundaria para concienciar sobre el cambio climático 
al modelar el rápido crecimiento de las emisiones de CO2, el aumento de la temperatura global y el derretimiento del hielo. 
Estos modelos permiten a los estudiantes visualizar cómo estos fenómenos pueden acelerarse si no se toman medidas para 
reducir las emisiones. 
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1 Introducción 


Para desarrollar el tema es necesario definir previamente la función real de variable real. 
Una función f, es una correspondencia entre D CR y R definida de la forma: 


F:D>R 


o y=$f(r) 


tal que Vx € D se cumple que f(x) es único. 

La variable x se denomina independiente y el conjunto de todos los puntos x € D se denomina dominio de la función 
Dom(f). La variable y se denomina dependiente y el conjunto de valores de y = f(x) se denomina recorrido, rec(f) = [y € 
R|f(2) =y,v € R) 

Representar una función consiste en trazar la curva que describe todos los puntos definidos por las parejas (1, y = f(x)) 
Vx € Dom(f(x)) en los ejes cartesianos donde x es la coordenada del eje horizontal o de abscisas e y es la coordenada del 
eje vertical u ordenadas. La gráfica dará lugar a una curva en dos dimensiones. Si función dependiera de dos variables 
independientes la curva sería de tres dimensiones (z = f(x, y)). 

En este tema nos centraremos en las funciones reales de variable real en 2 dimensiones. Estas funciones aparecen en 
múltiples ocasiones en la naturaleza como la relación ente espacio y tiempo s = s(t) = sy +. -t+0.5-a-t? (donde sy , vo, 
a son números reales conocidos); en las ciencias sociales como la función sobre la oferta y la demanda; y en la vida cotidiana 
donde por ejemplo la relación entre el precio de un parking y el tiempo que has aparcado el coche. 

En la actualidad el auge de la representación de las funciones es fruto de la facilidad de representar cualquier función a 
partir de ordenadores, tablets o móviles. Algunas aplicaciones informáticas como geogebra, wiris, derive, Mathematica para 
ordenador o Mathlab Calculator para móviles y tabletas son muy fáciles de usar y bastante potentes. 

En este tema bocetaremos las funciones, es decir ver las gráficas de la función “a grandes rasgos” estudiando su 
comportamiento viendo las características más importantes de las mismas: dominio, continuidad, simetría, periodicidad, 
cortes con los ejes, asíntotas y tendencias, monotonía, puntos relativos, curvatura, puntos de inflexión. Utilizaremos para 
apoyarnos en el estudio de las funciones: 


ef) = 0 


3 
. g(x) = A 


2 Dominio 


El dominio de una función o campo de existencias es el conjunto de valores de la variable independiente, x, donde está definida 
la función. Gráficamente el estudio del dominio es sencillo pues sólo hay que observar en que valores del eje horizontal existe 
función. 

Si tenemos una función definida en forma de expresión algebraica y = f(x) los valores de x que no pertenecen al domino 
son los que o bien: 


e No definida en este punto (por ejemplo en algunas funciones definidas a trozos) 
e La expresión no tiene sentido: 


— Valores de x que hacen el argumento del logaritmo negativo o cero 
— Valores de x que hacen el radicando de las raíces de índice par negativo 


— Valores de x que anulan el denominador. 


Veamos el dominio en nuestros dos ejemplos y una función definida a trozos: 


o f(1) = e7(.=2 su dominio son todos los números reales, pues la función exponencial está siempre bien definida: 
dom(f) =R 


e g(x) = pe ¿ tenemos que eliminar del dominio los valores de x que anulan el denominador (1? — 4 = 0), por lo que 
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3 Continuidad de las funciones 


Una función f(x) continua en un punto x € Dom(f) si se verifica la siguiente igualdad: 


Mimo Fa) = fico) > f(x) continua en o 


Una función f(x) es continua por la izquierda en xo si se cumple lim f(x) = f(x0) y por la derecha si se cumple lim Ha) = 
TL) TL 


f(x0). Por lo tanto para ser continua debe de serlo por la derecha y por la izquierda. 
Una función es discontinúa en xy si no es continua. Tipos de discontinuidades: 


e Evitable: Existe lim f(x) pero o bien no existe f(x0) o su valor es distinto al límite 
LT>L0O 


e No evitable: No existe lim f(x) o vale infinito. 
T>LO 


— Salto finito: lim f(1) A lim Fa) 


TT LTL 


— Salto infinito: lim f(x) = +00 y/o lim f(x) = too 
LLO > 


Ejemplo gráfico: 


ÁS, Ejemplo gráfico: 


Salto finito x=-3: lim f()=3x% lim f(x) =1 
123 13 


Evitable x=1: limf(x) =1 pero x=1g2Dom(f) 


Salto infinito x=3: limf()=-00 lim (x) =00 
xx 13 


En nuestras funciones f(1) es continua en todo su dominio y g(w) es discontinua con salto infinito en 2 y —2 


4A Simetrías 


Una gráfica es simétrica respecto a una recta si a ambos lados de la recta la gráfica es igual (la recta es un espejo) y respecto 
a un punto O si todos los puntos P tiene un simétrico P” de forma que el punto medio es O (así OP = —OP' ). En este tema 
estudiaremos dos simetrías: 

Si una función verifica que f(-=x)=f(x) cualesquiera que sea x, es decir, toma los mismos valores a los dos lados del eje 
vertical Y, es simétrica respecto a este eje. A estas funciones se les llama pares. 


Ge SY) 


Si f()=-£(x) resulta simétrica con respecto al origen de coordenadas, denominándose a estas funciones impares. 


Y, 
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La notación par e impar es debida a que las funciones polinómicas f(1) = a, :1” +-+a1 - 1 + ag tienen simetría par si 
los únicos grados son los pares,y es impar si los grados son impares. 
Algunas propiedades de la simetría de funciones: 


e Si f(x) simetría impar y continua en x=0 se cumple f(0)=0. 
e Sea la función pG)=f):8(x) o d(x)=f(x)/8(x) se cumple: 


— Si f(x) y g(x) misma simetría p(x) y d(x) simetría parSi f(x) y g(x) misma simetría p(x) y d(x) simetría par 
— Si una función par y la otra impar entonces p(x) y d(x) serán impares. 
— Si alguna de las dos o las dos no simétricas entonces p(x) o d(x) no simetría. 
e Sea la función s(x)=f(x)+8(3) o r(x)=1f(x)-8(x) se cumple: 

— Si f(x) y g(x) simetría par s(x) y r(x) simetría par 
— Si f(x) y g(x) simetría impar s(x) y r(x) simetría impar 
— Si f(x) o g(x)no tienen simetría tampoco lo tendrán s(x) ni r(x). 

También puede darse simetría con respecto a la recta x= a si fla— x)= fla+ 1x1), Vx 


En nuestros ejemplos f(x) no tiene simetría par ni impar pues f(—x) 4 =f(x) (lo es respecto el eje x=2); g(X) en cambio 
e(x) tiene simetría impar pues g(—x) =—g(x) 


5 Periodicidad 


Una función y=f(x) es periódica si existe un valor T para el cuál f(x+T)= f(x) cualesquiera que sea x, es decir, cuando su 
gráfica se repite cada tramo de longitud T. También se verifica que f(x+2T)=£(x+-3T)=f(x-T)=£(x+kT), siendo k cualquier 
número entero. El menor valor de T' para el que se verifican estas igualdades se llama periodo. 


A a = UE uu 


(e : Juciouer olas 


Existen pocas funciones con expresión algebraica periódica, las más importantes son las funciones circulares (sen(x), cos(x), 
te(x), sec(x), cosec(x), cotg(x)). Estas funciones circulares tiene periodo de T = 27 (vuelta completa a una circunferencia). 

Podemos encontrar funciones periódicas asociadas a fenómenos que se repiten periódicamente en la naturaleza como las 
ondas, péndulos, fenómenos relativos a la duración estacional, etc. Aunque no se pueda definir una expresión algebraica 
se pueden describir otras funciones periódicas sin más que definir la función en un periodo e indicar que esta función es 
periódica. 

Proposición (Bernuilli): Sean f(x) y g(x) dos funciones reales se cumple que p(x) = f(x) - g(x) es periódica si cumplen f(x) 
y g(x) son periódicas con periodos T| y T2 tales que se cumple 2 = E (irreducible) € Q siendo el periodo de p(x), T = T” -p-q 
siendo 7” = 5 = 3 

Demostración: si una de las dos o las dos funciones no son periódicas el producto p(x) no puede ser periódico. Veamos 
ahora si son periódicas y cumplen que a € I el producto p(x) no es periódico: p(1+T)= fla+T)-g(2+T) = f(x) - glo), 
luego tenemos que buscar un valor T que sea múltiplo tanto de 7 como de Ta es decir m - Ta = mn: T, = T, que no existe 
pues entonces q = % € Q Si se cumple que las dos funciones periódicas con periodos + = ¿(irreducible) € Q entonces 
el periodo será un valor T menor múltiplo de 7, y T2, mcm(T1,T2). Partiendo de mem(T1,T2) - mcd(T1,T2) = T1 -T2, 


=py TZ) = q, despejamos y obtenemos: T =T1-q=T2-p 


T1 

mecd(T1,T2) 
Ninguno de nuestras dos funciones estudiadas f(x) ni g(x) son periódicas. 

6 Cortes con los ejes 

Una función corta con los ejes si alguna de las variables (coordenadas) es nula, casos: 


e Corte con el eje OY, cuando x=0 existiendo sólo un posible punto de corte si 0 € Dom(f) siendo este punto P y 


(0, y = £(0)) 


e Corte con el eje OX, cuando y = Opuede tener varios, tantos como soluciones a la ecuación f(x)=0. Si las soluciones 
son 21, ..., Zn los puntos de corte son (21,0), ..., (2, 0) 
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Calculemos los puntos de corte de nuestros dos ejemplos: 


eje OY(x=0): y=f(0)=e* >(0,e*) 


eje OX (y=0): 0= e“ no solución > no corte. 


a. f(x)= er | 


e eje OY(x=0): y= f(0)=0 > (0,0) 
Pl AM 3 
x” 4 | eje OX (y=0): 0=—7,x=0 > (0.0) 
0 a 


b.  g(x)= 


7  Asíntotas 


Una función f(x) tiene una asíntota cuando se aproxima a una recta en uno de los dos sentidos de la recta o en los dos 
infinitesimalmente. 
Podemos encontrar tres tipos de asíntota: 


e Horizontal: la recta y=L cuando lim f(x) =L 
TOO 


e Vertical: en x =a cuando lim f(x) =+o0 0 lim, f(x) = +00, o ambos. Los valores de a serán aquellos que generen 
r>a” rt>a 


que el límite sea infinito, por lo general son valores que o bien anulan el denominador de la función o el argumento del 
logaritmo. 

e Oblicuas: la recta y = mx + mn cuando m=- lim Han yn= lim f(x) -mx. Cuando m=0e y =n tenemos una 
E LT TOO 


too 


T J 
asíntota horizontal y si existe una asíntota horizontal no existe la oblicua. 


En la siguiente imagen podemos ver la posición relativa de la curva con respecto a la asintotas estudiadas: 


_—_—_— 


AH: y, = omita hrcrortol Posición! RQATUGA CURA DEPECZS AÑAJIOA 
b = 4 


0 A foo- 70 3. k—»-6 -=) L0) ¿Ju rO 
?. to y $00 gu <O Y. Xd => fue 


AV: x= A.v. 
Se hoce mn bh recto x=luE y x=l£ mm E£>70 
de x= ldE => y +0 3. x=L-E£ 34>+0 
Y xd Jo PUE 2.y>5 


AD: FP AD., y gue en el ab haz tal 
d.ximiao > $69 - 70 3.X—>3-0 => £09- ¿ro 
dm —y $0 p<0 ¿A =y $00 440 


T.RAMAS  PARABOLIAS 


Estudiemos ahora nuestras funciones: 
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AV: no tiene 
D fo)=e "14H :lime” =0, lime =0 y=0(para +00) 


x>0o x—>-0 


AO: no tiene al tener AH 


AV:en x=2 limg(x)=-=w lim g(x)=w en x=2 lim g(x)=w lim g(x)=-00 
Xx x>2 >2* x>2 x>2' 


g(x) == AH: no tiene . limg(x) =00, lim g(x) =-00 
q = x>0 x>0 
2 3 
40:y=x  m=timL tim =1; m=tim—-x=tim 2 =0 
E 12.14 2.x* 4 1. x*-—¿4 


8 Ramas parabólicas 


Una función tiene una rama parabólica si al crecer indefinidamente la x (por la izquierda o por la derecha), crece indefinidamente 
la función (por arriba o por abajo), pero sin acercarse a ninguna recta en particular. Las ramas parabólicas no son asíntotas 
de ningún tipo. Por lo tanto es condición necesaria que lim f(x) = +oo. 

T—>00 


Tenemos las siguientes ramas parabólicas: 


e lim de) = () puede tener una parabólica en la dirección del eje X. 
T—>IOO 
Y hd > > Y 
e Si lim £ (z) = +oo, entonces existe una rama parabólica en la dirección del eje Y. 
L—>TOO 
El 1 
[ 7 ' y =X NY) 
e Si lim Í (2) =mAX0y lim f(x) —- mí = +oo, entonces existe un rama parabólica con eje oblicuo y=x 
L—>TOO LT TOO 


Hay ramas parabólicas en aquellas funciones racionales, f(x) = P(x)/Q(x), en las que el grado del numerador está dos 
unidades o más por encima del grado del denominador. El estudio de posición relativa de la curva con respecto a éstas se 
hace de manera análoga al estudio de las asíntotas. 

En nuestros ejemplos no hay ramas parabólicas. En la primera no se da la condición necesaria y en la segunda si que se 


cumple que lim A =1X%0pero lim g(1)-mx=0 
T>TOO TT 00 


9 Monotonía 


Se llama monotonía al estudio del crecimiento y decrecimiento de la función. Veamos la definición de crecimiento y 
decrecimiento. 

La función es creciente en xy si existe un intervalo abierto (19 —09, 24 +09), con (9 > 0) tal que f(x) < f(xo) six € (109, to) 
y f(x) > f(z0) si x € (Zo, Lo + 6). 

La función es decreciente en xp si existe un intervalo abierto (19 — 9, 10 + 9, con (9 > 0) tal que f(x) > f(xo) si 
xE (19 —0,10) y f(x) < f(xo) si x € (Lo, Lo +9). 

Se cumplen las siguientes proposiciones: 


e Si f'(10) > 0 la función es estrictamente creciente en ese punto. En caso contrario (< 0) es decreciente. Esta condición 
no es necesaria. 


e Sea f una función continua en el intervalo cerrado [a, b] y derivable en (a, b), se verifica que si f” > 0 en (a, b) entonces 
es estrictamente creciente en [a,b]. En caso contrario f' < 0, es estrictamente decreciente. 
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e Sea f una función continua en el intervalo [a,b] y derivable en (a,b), se verifica que si f” > 0 en (a,b) entonces es 
creciente en [a,b]. En caso contrario f” < 0, es decreciente. 


e Sea f una función continua en el intervalo [a, b] y derivable en (a,b) tal que f'(x) = 0, f es constante Vx € (a, b) 


Veamos en nuestros dos ejemplos: 


si x>2 f'(x)<0 > decrece 
si x<2 f'(x)<0 > crece 


y ¡ge oe! 


e e a xa? -12)| si xe (=, 4/12) U (12, 0) f'(x)<0 > crece 
Ñ AS (4-47 |si xe(V12,412) f'()<0 > decrece 


10 Máximos y mínimos relativos 


Se dice que una función f tiene un máximo/mínimo relativo (o local) en un punto si existe un intervalo (7 = xy — 0, tp +0) 
tal que Vx € l, f(x) < flco)/f(x) > f(xo). 

No debe confundirse un máximo relativo con el máximo absoluto. Si el máximo absoluto de una función no es alcanzado 
en un punto interior Xy no hay máximo relativo en dicho punto ya que para afirmar la existencia de éste hay que considerar 
puntos a izquierda y derecha de xy y para ello resulta esencial que el punto sea interior. Se aplica todo lo anterior para 
mínimos absolutos y relativos. 

Una función monótona definida en un intervalo cerrado alcanza el máximo/mínimo absoluto en uno de los extremos el 
intervalo pero en este punto no existe máximo/mínimo relativo. 

Con respecto a esta sección se añaden dos proposiciones más: 


e Sea f una función definida sobre un intervalo abierto (a,b). Si xy es un máximo (o mínimo) para f sobre (a,b) y f es 
derivable en xy entonces f'(x0) = 0. El recíproco no es cierto. 


e Sea f una función continua no constante en el intervalo compacto [a,b]. Entre dos máximos locales existe siempre un 
mínimo local. O entre dos mínimos locales existe siempre un máximo local. 


10.1 Determinación de máximos y mínimos 


Es condición necesaria para que la función f(x) tenga en xy un máximo o un mínimo que f'(x0) = 0. Para buscar los máximos 
y mínimos de una función comenzamos por hallar los puntos x tal que f'(x) = 0, que se llaman puntos críticos o singulares. 
En cada uno de ellos la tangente es horizontal y puede haber un máximo o un mínimo. Para ver de cual se trata se tienen 
los siguientes criterios: 


e Valoración de la función: Si 1 es un punto crítico, sustituimos en la función x = ty + h, siendo h lo suficientemente 
pequeño (hFoh>), si f(x) > f(x0) resulta mínimo, si f(x) < f(x0) resulta máximo, y si hay algún cambio de signo y 
en un semientorno se verifica una de estas desigualdades y la contraria en el otro, no hay extremo. 

e Variación de f'(1): Supongamos f tenga f” en un entorno de zp. Teorema: Si al crecer x, pasando por to, f'(x) cambia 


de signo (en un entorno de xp) de negativo a positivo, resulta un mínimo, si es de positivo a negativo, un máximo y si 
no hay cambios de signo, no hay extremos. 


e Teorema: para que Xy sea máximo relativo (mínimo) ha de cumplirse que f'(10) = 0 y que la primera derivada no nula 
sea f ”(2p) con n par cumpliéndose f ”(x9) <0 (f£”(x0) > 0). 


Generalmente para estudiar los puntos relativos basta con ver los valores de x que anulan la primera derivada y comprobar el 

signo de la segunda. En caso que los ceros de la derivada sean de multiplicidad dos serán en cambio puntos de inflexión pues 

anularán también f” (x) y no f””(x), si son triples serán puntos relativos pues anula la segunda y la tercera y no la cuarta... 
Veamos en nuestros dos ejemplos: 


D f)=e“Y > f0)=-Axr-2ye 5% =0>x=2 f"(2)<0 máximo M(2,1) 


3 


2 = 
) gl) A 
A x=-V12 g"(-412)<0 máximo M(-4/12,34/3) 
> 81) =2 Pe 0 >3x=0 g"(0)=0 y g'"(0)+0 Punto Inflexión 


Ae x=4/12 g"(/12) >0 minimo m(4/12,-34/3) 
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11 Curvatura y puntos de inflexión 


Una función es cóncava hacia las y positivas en un punto P, de abscisa zp, si todos los puntos de la curva próximos a P están 
situados por encima de la recta de la tangente en P. La pendiente crece. 

Una función es cóncava hacia las y negativas en un punto P, de abscisa xp, si todos los puntos de la curva próximos a P 
están situados por debajo de la recta de la tangente en P. La pendiente decrece. 

Teorema: una función f(x) es cóncava hacia las y positivas (hacia las y negativas) en zp si cumple que existe la segunda 
derivada y cumple f”(x0) > 0 (f”(x0) < 0). 


.e >|. > 
Cóncava Cóncava 
hacia arriba hacia abajo 


Una función tiene un punto de inflexión si cambia la curvatura, esto ocurre si la primera derivada no nula en y ,a 
excepción de f(x0), es de orden impar. 
Veamos en nuestros dos ejemplos: 


Y f=e*>fM0)=20 847) Y =0> 


seta 2 2,2) f”(x)<0 convexa; 0e[-a 2 Buls E a JF"o0 cóncava 
2 2 ES: 3 
3 2 2 
$ 20. ÁREA e 000 
x 4 (x* —4) 


xe(-2,0)u(2,0) es cóncava y de (-0,-2)uU(0,2) convexa. 


12 Aplicaciones de la representación gráfica 


Con todos los datos obtenidos en los anteriores puntos se hace un boceto de la función. Veamos en nuestros dos casos. 
F(X) 
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13 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. La materia correspondiente a este tema se estudia a 
partir de 32 de la ESO y en Matemáticas 1 y Matemáticas Aplicadas a las Ciencias Sociales I, en el sentido algebraico dentro 
de los saberes básicos, cada año profundizando y formalizando más su estudio. 

En 30 y 4 de secundaria se aborda la representación de funciones sencillas: rectas, funciones cuadráticas, exponenciales, 
logaritmo, funciones de proporcionalidad inversa. En secundaria los alumnos no han aprendido a derivar por lo que se estudia 
estas gráficas a partir de dar valores numéricos e identificar la gráfica con el tipo de función y algunas de sus características 
analizando gráficamente la función. 

En bachillerato (ambas ramas) se representa todo tipo de funciones siguiendo los mismos pasos desarrollados en el tema. 
La representación de funciones es, de hecho, unas de las preguntas recurrentes de los exámenes de acceso a la universidad. 

Su conexión con su representación gráfica nos permite trabajar especialmente la competencia específica número 5 de la 
ESO: Reconocer y utilizar conexiones entre los diferentes elementos matemáticos, interconectando conceptos y procedimientos, 
para desarrollar una visión de las matemáticas como un todo integrado. 
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1 Introducción: El método estadístico 


La Estadística actual es el resultado de la confluencia de dos disciplinas científicas que, tras evolucionar de modo independiente, 
alumbraron una nueva ciencia en el siglo XIX. Estas disciplinas son el Cálculo de Probabilidades, cuyo origen se remonta al 
siglo XVII, y la "Ciencia del Estado” con raíces más antiguas. 

Con cierta imprecisión se puede definir la Estadística cono una ciencia que estudia cómo obtener, mediante el uso de 
modelos matemáticos, conclusiones de una investigación empírica sobre el comportamiento de un colectivo. Es decir, busca 
las características generales de un grupo a partir de la experimentación y estudio de casos particulares. Sin embargo, el 
objetivo de la estadística no es estudiar el comportamiento de casos aislados, simplemente los usa como medio para estudiar 
el comportamiento del grupo. Las regularidades del grupo total se obtienen tanto mejor cuanto más grande es el grupo 
estudiado. 

El método estadístico se aplica en todos los hechos para los cuales la multiplicidad de sus causas y su complejidad hace 
imposible la utilización de un modelo matemático determinista. Este método estadístico consiste, en esencia, en las siguientes 
fases: 


e Recogida de la documentación relativa a un conjunto de hechos de igual naturaleza (recolección de datos). 


Análisis e interpretación de los datos recogidos 
e Inferencia de propiedades de la población o predicciones futuras a partir de los datos analizados 


La ciencia o parte de la estadística encargada de realizar selecciones adecuadas de los individuos de una población para 
que la recogida de datos referida a la primera fase del proceso se denomina muestreo. 

De la segunda etapa se encarga la denominada estadística descriptiva; no basta con registrar los datos, sino someterlos 
a una crítica inteligente, realizar los cálculos pertinentes asociados a dichos datos y reunir los resultados definitivos tablas 
estadísticas o gráficas para su interpretación. 

La tercera etapa, es la que conecta la estadística con los modelos matemáticos estocásticos. En resumen, la estadística 
descriptiva se ocupa de ordenar y analizar los datos recogidos de un subconjunto de una población y, valiéndonos del cálculo 
de probabilidades, podemos hacer inferencias acerca de esa población. Ordinariamente, dichas inferencias versarán sobre 
los parámetros de la población a partir de las estadísticas de la muestra. También pueden hacerse sobre la forma de la 
distribución. Esto es lo que se denomina inferencia estadística. 


2 Definiciones de términos estadísticos 


Toda investigación estadística debe estar necesariamente referida a un conjunto o colección de personas o cosas que verifiquen 
una definición bien determinada. 

Se llama población a este conjunto o colección. Los objetos o individuos el que componen una población recibían el 
nombre de elementos y pueden tener existencia real o referirse a objetos o conceptos abstractos. Es decir, pueden coincidir 
con unidades naturales o pueden ser creados de forma artificial. El tamaño de una población viene dado por el número de 
elementos que la componen. Dicho tamaño y puede ser finito o infinito. Los elementos de la población presentan ciertas 
propiedades o cualidades a las que llamaremos caracteres. Los caracteres de los elementos que componen una población los 
dividiremos según sean de carácter cuantitativo o cualitativo. 

Los caracteres cuantitativos se denominan variables y son aquellos que pueden describir se de forma numérica. Es decir, 
la observación produce números que son los valores de la variable. Las variables estadísticas asumen pueden dividirse entre 
discretas y continuas (aunque no es una separación total ya que podemos encontrar variables que no son ni totalmente 
discretas ni totalmente continuas). 

Se habla de variables discretas cuando se puede suponer entre dos puntos de la escala de medida existe un número finito 
de valores potenciales de la característica que estamos midiendo. 

Se habla de variables continuas en el presupuesto teórico de que, entre dos puntos cualesquiera de la escala, existe un 
número infinito de valores potenciales de la característica que estamos midiendo. 

Los caracteres cualitativos o, atributos, son los que se describen mediante palabras. Un atributo tiene distintas formas 
de presentación a las que denominaremos modalidades. 


3 Observación de una población. Muestreo. 


La observación de una variable implica la obtención de un número en cada elemento de la población y dicho número puede 
obtenerse de las siguientes maneras: 


e Aplicando la unidad de medida adecuada cuando dicha unidad existe. 


e Empleando un sistema convencional de puntuaciones cuando no existe unidad de medida. 
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e Asignar un rango entre los elementos de la población, es decir, ordenarlos de mejor a peor y una vez ordenados asignar 
un valor a su número de orden. 


Con cualquiera de los tres sistemas se obtienen siempre números que son los valores de la variable de estudio, también 
se les denomina indistintamente, datos u observaciones. Sin embargo, los dos últimos sistemas no son tan objetivos ni tan 
exactos como el primero. Por ejemplo, número de hermanos, notas en un examen, capacidad de resistencia a través del orden 
de llegada en una carrera. 

En cuanto a los atributos, la observación implica obtener en cada elemento la modalidad correspondiente. Los resultados 
se suelen denominar, indistintamente datos u observaciones. 

Resaltemos algunas diferencias importantes entre variables y atributos: Con los valores de una variable la población 
queda ordenada o jerarquizada de forma natural según el orden que nos proporciona el número asignado a cada elemento. 
Sin embargo, con los atributos, esta jerarquización no es posible. 

Una variable puede estudiarse en forma de atributo. Basta con agrupar los valores de la variable en modalidades. Por 
ejemplo, en el atributo color las modalidades pueden ser: rojo, amarillo, morado... 

Después de seleccionar los caracteres que consideramos básicos para la investigación y delimitar la forma de observarlos, 
debemos proceder a la observación del valor sobre los elementos de la población de estudio. Surge ahora un nuevo problema 
relacionado con el tamaño de la población y los recursos disponibles. Lo cual nos va a llevar a considerar dos métodos 
diferentes de observación. 


e Observación exhaustiva: Es la que se realiza cuando podemos observar todos los elementos de la población. En principio 
en que se basa esta observación es sencillo, aunque la ejecución suele ser laboriosa y su coste elevado. 


e Observación parcial: Sólo pueden observarse una parte determinada de la población. Se puede realizar de dos formas. 
Bien observando un estrato u observando una muestra. 


Diremos que hemos observado un estrato o estrato cuando los elementos que la componen reúnen unas características 
especiales que no se presentan en los restantes elementos. 

Se dice que se ha observado una muestra cuando los elementos que la integran no reúnen ninguna característica esencial 
que los distinga de los restantes elementos. 

Si trabajamos sobre una muestra, las conclusiones extraídas sobre esta deberían ser extrapolables al conjunto de la 
población. Cosa que no ocurre si trabajamos sobre una subpoblación. La ventaja de trabajar con subpoblaciones es que 
podemos centrarnos en el estudio de un subconjunto de la población que presenta alguno de los caracteres en los que estamos 
interesados en nuestro estudio. 

En ocasiones puede ser interesante realizar una observación MIXTA de forma que nos centremos en alguna característica 
importante para el estudio mediante subpoblaciones y el resto de características se estudian mediante muestreo. 

Centrándonos en las muestras, el problema surge al intentar que la muestra de elementos seleccionada sea representativa, 
es decir, las conclusiones extraídas sobre la muestra puedan extrapolarse al conjunto de la población como deseamos que 
ocurra. Las preguntas son varias: 


e ¿Cómo seleccionamos la muestra de elementos para que estos resulten representativos? 


e ¿Cuál debe ser el tamaño de la muestra para que esto ocurra? O dicho de otra manera, ¿cuál es el tamaño mínimo 
que ha de tener una muestra para que sea grande la probabilidad de que al sustituir la característica poblacional por 
la muestral el error cometido sea pequeño? 


La respuesta a la primera pregunta es, que si queremos que la muestra sea representativa y poder usar el cálculo de 
probabilidades cada miembro de la población debe tener la misma probabilidad de formar parte de la muestra y, en la 
extracción de cada individuo, la composición de la población debe ser idéntica. Aparece en este caso, el muestreo aleatorio 
simple. Debido a la imposibilidad de llevarlo siempre a la práctica y para ajustarse a las características de ciertas poblaciones 
aparecen otros tipos de muestreo como el estratificado o por conglomerados. El muestreo no es el concepto central del tema 
que nos ocupa así que no entraremos a detallar estas técnicas de muestreo. 


4 Estadística descriptiva 


Una vez recogidos los datos sobre la muestra o sobre la población, el siguiente paso es realizar un análisis y descripción de los 
datos. Se trata de resumir adecuadamente la información que la colección de datos contiene para su correcta interpretación. 
En su versión más sencilla esto se realiza por medio de tablas que recogen las frecuencias relativas y absolutas, simples 
o acumuladas, puntuales o por intervalos, de los datos obtenidos, y que van acompañadas de gráficos que las ilustran: 
diagramas de sectores, de barras, polígonos de frecuencias, histogramas,... La mejor o peor adecuación de cada gráfico al 
tipo de característica estudiada depende de la naturaleza de la misma. Se usan representaciones distintas para variables y 
atributos y también hay diferencias entre variables discretas y continuas. 


Tema 57 


También es propio de la Estadística Descriptiva la introducción de los llamados parámetros estadísticos, entre los que 
se suelen distinguir los de centralización, los de dispersión y los de forma. Entre los primeros son esenciales la media, los 
cuartiles y percentiles, especialmente la mediana, y las modas. Todos ellos representan valores “alrededor de los cuales se 
concentran los datos” 

Para saber en qué medida se concentran los datos alrededor de un valor se emplean los momentos, o parámetros de 
dispersión. El más relevante es la varianza, pero también tienen interés el coeficiente de variación de Pearson, que tiene 
carácter relativo (es adimensional) y la mediana de las desviaciones absolutas. 

Los parámetros de forma se emplean para poblaciones grandes y, como su nombre indica, dan cuenta de la forma de las 
gráficas que se emplean para representar los datos. En esencia, reflejan la existencia de simetrías y miden el mayor o menor 
“aplastamiento” de sus gráficas. De lo primero se encarga el denominado coeficiente de asimetría de Pearson, y de lo segundo 
el parámetro de curtosis. Con frecuencia estos datos proporcionan pistas de la distribución que sigue la población. 

En ocasiones los datos son vectores con, por ejemplo, dos coordenadas. Esto se debe a que para cada elemento de la 
población (de la muestra) observamos dos (o más) variables o atributos diferentes. La Estadística Descriptiva se centra 
entonces en estudiar si existen relaciones funcionales entre los valores de las variables observadas y de ser así decidir cuál 
es la naturaleza de la misma. De ello se ocupa la teoría de la regresión y correlación. El caso básico y más importante es 
el de regresión lineal, que trata de determinar si existe una relación lineal entre dos variables, X e Y, y en caso afirmativo 
determinar los parámetros a, b, de forma que la regresión Y = aX + b se ajusta ”lo mejor posible” a los datos observados 
(minimiza los errores cuadráticos). La existencia de otras relaciones funcionales puede reducirse al estudio de una correlación 
lineal previo cambio de variable: Una relación exponencial del tipo Y = b” - a , puede estudiarse como una relación lineal 
InY =uX +. 


5 Inferencia estadística 


El interés máximo de la Estadística es su capacidad para predecir. Este es, simplificando, el objetivo de la Estadística 
Inferencial. Si tenemos una población y una variable sobre ella, puede interesarnos conocer la distribución de esta variable o 
algún parámetro concreto de la misma. La determinación exacta de la variable mediante un modelo probabilístico concreto 
o el cálculo del parámetro en cuestión, resultan en muchos casos imposibles de realizar. ¿Cuánto costaría encuestar a todos 
los miembros de un censo para averiguar su intención de voto? O más difícil aún, ¿Cómo medir cierta característica física de 
todas las arañas del mundo? 

La Estadística Inferencial proporciona diversos métodos para obtener conclusiones sobre la población en estudio mediante 
el examen de las variables en las que estemos interesados, no en todos sus miembros sino sólo en una parte de ella, generalmente 
pequeña a la que hemos denominado muestra. Para ello es necesario, como ya hemos dicho, que la muestra sea representativa 
y de este problema se encargan las técnicas y teorías de muestreo. En el desarrollo de estas técnicas interviene de un modo 
sustancial la teoría de la Probabilidad y se trata de realizar muestras que no produzcan resultados sesgados. Suele interesar 
para ello que el muestreo sea aleatoria, es decir, que todos los elementos de la población tengan las mismas probabilidades 
de ser elegidos. 

En el proceso de modelización del mundo real, la Estadística atribuye a la característica a estudiar en la población cierta 
función de distribución. Por ejemplo, es un hecho empíricamente probado que la mayoría de las características biológicas de 
una población, siguen una distribución normal, pero habitualmente se desconocen los valores de su media y su desviación 
típica. Este es uno de los problemas abordados por la denominada Inferencia paramétrica. En esta situación se asume que 
la función de distribución de la variable aleatoria a estudiar pertenece a una familia de funciones Fy|0 € X, donde X es un 
subconjunto de R” llamado espacio paramétrico. La Estadística inferencial trata de precisar qué información proporciona la 
muestra sobre el valor de 6. 

Por ejemplo, si sabemos (o podemos asumir) que la variable asociada a una población sigue una distribución normal, 
nuestro parámetro será 0 = (p,o) € RR. Es decir, idealmente, desearemos averiguar los valores de la media y de 
la desviación típica de la población, con lo que quedaría determinada la variable de estudio. Se habla en este caso, de 
estimación por punto, y los parámetros de la muestra que nos determinen los valores que usaremos para inferir los parámetros 
poblacionales se llaman estimadores puntuales. 

De forma más realista, un objetivo de interés es obtener un subconjunto “pequeño” / € X, de modo que sea también 
“pequeño” el riesgo de error al afirmar que 0 € /. Esta es la que se conoce como estimación por intervalos de confianza. 

Por último, es frecuente que nos enfrentemos al problema de decidir, basándonos en la muestra y fijada una cierta partición 
(X = AU(X — A)) del espacio paramétrico, si es más verosímil la hipótesis denominada nula Hoy € A o la hipótesis alternativa 
H,:0€ X — A. De resolver este tipo de cuestiones se encargan los contrastes de hipótesis. 

Ahondemos un poco más en el significado de hipótesis nula y el porqué de su denominación. Se denomina hipótesis 
nula Ho a la hipótesis que se desea contrastar. El nombre de ”nula” significa “sin valor, efecto o consecuencia”, lo cual 
sugiere que Hy debe identificarse con la hipótesis de no cambio no diferencia, no mejora, etc. Hp , representa la hipótesis 
que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de “neutra”. 
La hipótesis nula, nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que 
dos poblaciones tienen la misma media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras 
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suficientemente grandes de ambas poblaciones, pero no puede ser ”demostrada” mediante muestreo, puesto que siempre cabe 
la posibilidad de que las medias difieran en una cantidad lo suficientemente pequeña para que no pueda ser detectada, aunque 
la muestra sea muy grande. 

Asociados a los contrastes de hipótesis aparecen siempre dos tipos de errores el de tipo I, se rechaza la hipótesis nula 


siendo cierta y el de tipo Il, se acepta la hipótesis nula siendo falsa. Suele intentar controlarse especialmente el error de tipo 
L 


6 Aplicaciones de la estadística 


Aunque las aplicaciones de la estadística son muy diversas y están en continua evolución, trataremos de enunciar las más 
importantes: 


6.1 Estadística como ”Ciencia del estado” y ciencia social 


Hoy en día, observamos la relevancia de las "estadísticas oficiales” para el funcionamiento de un Estado y sus relaciones 
exteriores. Así, casi todos los países cuentan con Institutos Oficiales de Estadística (INE en España) que armonizan sus 
métodos estadísticos a través del Instituto Internacional de Estadística (ISI). En España, incluso algunas comunidades 
autónomas tienen sus propios institutos de estadística, que se preocupan de sus particulares temas de interés. También 
son fundamentales los estudios sociológicos sobre la evolución de los ciudadanos en los más diversos temas, de los que en 
nuestro país se ocupa el Centro de Investigaciones Sociológicas (CIS). Existen otras muchas estadísticas de interés en diversos 
campos y que se realizan a través de las empresas privadas de estadística, de la que hay un buen número en nuestro país. 
Destacaremos las "reglas estadísticas” (publicadas en BOE) que permiten la armonización de los controles de calidad en las 
empresas y la adjudicación de ”sellos” de calidad. 

Otro de los orígenes de la estadística son los primeros estudios sobre tablas de mortalidad, principalmente aplicadas por las 
compañías de seguros, hasta los complejos modelos econométricos, la estadística ha supuesto una herramienta fundamental 
en todas las ciencias centradas en el estudio de los seres humanos y sus relaciones. Así, habitualmente, podemos encontrar 
“estadísticas” en estudios económicos, demográficos, sociológicos, psicológicos, políticos, geográficos, educativos, etc. Como 
ejemplos podemos señalar desde las sencillas “pirámides de población”, las tasas de natalidad o los tests psicotécnicos, hasta 
los complejos modelos estadísticos usados para modelizar el funcionamiento de los mercados económicos. 

Vale la pena destacar la aportación de la estadística al trabajo por acabar con las desigualdades sociales ya que nos brinda 
una visión cuantitativa de las diferencias estructurales en nuestra sociedad (machismo, racismo, LGTBlfobia...), lo que nos 
permite identificar problemas, medir su alcance y desarrollar soluciones informadas. A través de un análisis riguroso de los 
datos, podemos trabajar hacia una sociedad más justa e inclusiva para todos. 

Por ejemplo, consideremos el análisis estadístico de la brecha salarial de género. Los datos muestran consistentemente 
que las mujeres ganan menos que los hombres en muchos campos laborales, incluso cuando tienen la misma educación y 
experiencia. Al desglosar estos datos por sector, ubicación geográfica y otros factores, los investigadores pueden identificar 
áreas específicas donde la brecha salarial es más pronunciada, lo que permite a los responsables de políticas y activistas dirigir 
sus esfuerzos hacia la igualdad de remuneración. 


6.2 Aplicaciones en las ciencias experimentales 


La estadística es una herramienta fundamental en casi todas las ciencias experimentales ya que permite medir las diferencias 
entre los valores experimentales obtenidos y los valores esperados según el modelo teórico supuesto ("método científico”). 
Así, en Física, los métodos estadísticos se pueden utilizar para controlar los errores de medida y, por ejemplo, estudiar si los 
modelos de la mecánica de Newton (también los postulados relativistas de Einstein) coinciden con los valores experimentales 
observados. En otras ocasiones los modelos físicos incluyen modelos estadísticos y probabilísticos como las Leyes de la 
termodinámica (mecánica estadística) o los postulados cuánticos como el principio de incertidumbre. 

La Biología es, quizás, la ciencia donde más aplicaciones estadísticas se utilizan, desde las primeras aplicaciones para la 
constatación empírica de la teoría de la evolución de Darwin o la clasificación de especies, a las numerosísimas aplicaciones 
actuales, como lo prueba de hecho de que dos de las mejores revistas de estadística se llamen “Biometrika” y “Biometrics”. 
También en la Biología los modelos estadísticos se incorporan a los modelos biológicos, como ocurre, por ejemplo, en las Leyes 
de Mendel. Las aplicaciones en otras ciencias son numerosísimas y, por ello, la estadística es una asignatura fundamental en 
los grados de Químicas (velocidad de reacciones químicas, composiciones, ...), Medicina, Veterinaria... Cabe destacar en las 
aplicaciones de la estadística en las Ciencias de la Salud el uso de la estadística inferencial y en concreto de los contrastes 
de hipótesis para la toma de decisiones en la eficacia de tratamientos y pruebas de detección de enfermedades, en donde 
juegan un papel decisivo los errores de tipo I y II asociados al test. Por ejemplo, probabilidad de estar sano habiendo dado 
positivo en un test (falsos positivos) o, el que se intenta minimizar, probabilidad de estar enfermo habiendo dado negativo 
(falsos negativos). Durante la pandemia del coronavirus del 2020 con las PCRs y test de autodiagnóstico estos conceptos 
estadísticos llegaron a la población general así como otros relacionados con la transmisión del virus, la mortalidad, etc; 
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6.3 Aplicaciones en la industria y el comercio 


También la Estadística es una asignatura obligatoria en casi todas las ingenierías, donde son utilizadas desde para estudiar la 
resistencia de un determinado material, hasta para el estudio de plantaciones agrícolas en las que influyen diversos factores. 
En las empresas e incluso en algunos comercios, las estadísticas son fundamentales para medir su evolución, o realizar un 
control de calidad sobre los productos fabricados o recibidos. En este punto, la estadística ha supuesto un peldaño más en la 
competencia entre empresas, por lo que las empresas de mayor importancia disponen de un departamento propio de control 
de calidad donde se investigan nuevos y más eficaces métodos estadísticos. 

En este contexto resaltamos un razón más por las que es necesario el muestreo ya que algunas de las mediciones de 
atributos/variables pueden resultar en la destrucción de los objetos estudiados y por lo tanto solo puede aplicarse a una parte 
de la población. Por ejemplo, las horas de duración de una bombilla antes de fundirse o el peso que soporta una cuerda antes 
de romperse. 


6.4 Big Data 


Erik Larson utilizó este término por primera vez en 1989 y hace referencia al almacenamiento de grandes cantidades de 
datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. El fenómeno del big data 
también se denomina a veces datos a gran escala, aunque suele usarse su denominación en inglés. La disciplina dedicada a 
los datos masivos se enmarca en el sector de las tecnologías de la información y la comunicación. Esta disciplina se ocupa de 
todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos. Las dificultades más habituales 
vinculadas a la gestión de estas cantidades de datos se centran en la recolección y el almacenamiento, búsqueda, compartición, 
análisis, y visualización. La tendencia a manipular enormes cantidades de datos se debe a la necesidad en muchos casos de 
incluir dicha información para la creación de informes estadísticos y modelos predictivos utilizados en diversas materias, 
como los análisis de negocio, publicitarios, los datos de enfermedades infecciosas, el espionaje y seguimiento a la población 
o la lucha contra el crimen organizado. En lo que se refiere al análisis de datos masivos se han desarrollado nuevas técnicas 
de tratamiento. La rama de la estadística que trata estas técnicas de denomina “Minería de datos” y tiene como objetivo 
encontrar comportamientos predictivos. Engloba el conjunto de técnicas que combina métodos estadísticos y de machine 
learning con almacenamiento en bases de datos. Está estrechamente relacionada con los modelos utilizados para descubrir 
patrones en grandes cantidades de datos. 

Estas técnicas son fundamentales para descubrir patrones significativos en grandes volúmenes de información, lo que ha 
llevado a un aumento cualitativo en el análisis de datos masivos. 


6.5 En el deporte 


Las estadísticas son imprescindibles en el mundo del deporte, cualquier equipo/deportista que se precie debe estudiar sus 
propias estadísticas y las de sus competidores para poder planificar una estrategia ganadora. 

Los expertos deportivos también estudian las estadísticas para poder hacer sus previsiones y análisis. En el mundo 
del béisbol se creó hasta un término para hacer referencia al estudio de sus estadísticas ”sabermetrics”. Este término fue 
acuñado por Bill James, el autor de los best-seller ” The Bill James Historical Baseball Abstract” (70s), en las que recopilaba 
las estadísticas más relevantes de este deporte. Aparecían nuevas métricas que permitían detectar juegadores valiosos que 
pasaban desapercibidos con las métricas tradicionales. Durante dos décadas la utilidad de estas métricas fue cuestionada, 
incluso tomada a broma, hasta que un equipo las aplico de manera tajante en su estrategia deportiva. Oakland Athletics era 
el equipo con menos presupuesto de la liga de béisbol y gracias a las estrategias aplicadas basándose en la estadística ganaron 
el 77% de los partidos y quedaron segundos en la liga en 2001 y primeros en 2002. Este éxito fue recogido tiempo después en 
un libro ”Moneyball”, en la actualidad también hay una película con este nombre. Este fue un punto de inflexión del estudio 
de la estadística deportiva, ya que no solo se extendió a otro equipos de béisbol si no al resto de categorías deportivas. 


7 Aspectos didácticos 


Ver temas siguientes de estadística. 
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1 Introducción: El método estadístico 


La Estadística actual es el resultado de la confluencia de dos disciplinas científicas que, tras evolucionar de modo independiente, 
alumbraron una nueva ciencia en el siglo XIX. Estas disciplinas son el Cálculo de Probabilidades, cuyo origen se remonta al 
siglo XVII, y la "Ciencia del Estado” con raíces más antiguas. 

Con cierta imprecisión se puede definir la Estadística cono una ciencia que estudia cómo obtener, mediante el uso de 
modelos matemáticos, conclusiones de una investigación empírica sobre el comportamiento de un colectivo. Es decir, busca 
las características generales de un grupo a partir de la experimentación y estudio de casos particulares. Sin embargo, el 
objetivo de la estadística no es estudiar el comportamiento de casos aislados, simplemente los usa como medio para estudiar 
el comportamiento del grupo. Las regularidades del grupo total se obtienen tanto mejor cuanto más grande es el grupo 
estudiado. 

El método estadístico se aplica en todos los hechos para los cuales la multiplicidad de sus causas y su complejidad hace 
imposible la utilización de un modelo matemático determinista. Este método estadístico consiste, en esencia, en las siguientes 
fases: 


e Recogida de la documentación relativa a un conjunto de hechos de igual naturaleza (recolección de datos). 


Análisis e interpretación de los datos recogidos 
e Inferencia de propiedades de la población o predicciones futuras a partir de los datos analizados 


La ciencia o parte de la estadística encargada de realizar selecciones adecuadas de los individuos de una población para 
que la recogida de datos referida a la primera fase del proceso se denomina muestreo. 

De la segunda etapa se encarga la denominada estadística descriptiva; no basta con registrar los datos, sino someterlos 
a una crítica inteligente, realizar los cálculos pertinentes asociados a dichos datos y reunir los resultados definitivos tablas 
estadísticas o gráficas para su interpretación. 

La tercera etapa, es la que conecta la estadística con los modelos matemáticos estocásticos. En resumen, la estadística 
descriptiva se ocupa de ordenar y analizar los datos recogidos de un subconjunto de una población y, valiéndonos del cálculo 
de probabilidades, podemos hacer inferencias acerca de esa población. Ordinariamente, dichas inferencias versarán sobre 
los parámetros de la población a partir de las estadísticas de la muestra. También pueden hacerse sobre la forma de la 
distribución. Esto es lo que se denomina inferencia estadística. 


2 Definiciones de términos estadísticos 


Toda investigación estadística debe estar necesariamente referida a un conjunto o colección de personas o cosas que verifiquen 
una definición bien determinada. 

Se llama población a este conjunto o colección. Los objetos o individuos el que componen una población recibían el 
nombre de elementos y pueden tener existencia real o referirse a objetos o conceptos abstractos. Es decir, pueden coincidir 
con unidades naturales o pueden ser creados de forma artificial. El tamaño de una población viene dado por el número de 
elementos que la componen. Dicho tamaño y puede ser finito o infinito. Los elementos de la población presentan ciertas 
propiedades o cualidades a las que llamaremos caracteres. Los caracteres de los elementos que componen una población los 
dividiremos según sean de carácter cuantitativo o cualitativo. 

Los caracteres cuantitativos se denominan variables y son aquellos que pueden describir se de forma numérica. Es decir, 
la observación produce números que son los valores de la variable. Las variables estadísticas asumen pueden dividirse entre 
discretas y continuas (aunque no es una separación total ya que podemos encontrar variables que no son ni totalmente 
discretas ni totalmente continuas). 

Se habla de variables discretas cuando se puede suponer entre dos puntos de la escala de medida existe un número finito 
de valores potenciales de la característica que estamos midiendo. 

Se habla de variables continuas en el presupuesto teórico de que, entre dos puntos cualesquiera de la escala, existe un 
número infinito de valores potenciales de la característica que estamos midiendo. 

Los caracteres cualitativos o, atributos, son los que se describen mediante palabras. Un atributo tiene distintas formas 
de presentación a las que denominaremos modalidades. 


3 Observación de una población. Muestreo. 


La observación de una variable implica la obtención de un número en cada elemento de la población y dicho número puede 
obtenerse de las siguientes maneras: 


e Aplicando la unidad de medida adecuada cuando dicha unidad existe. 


e Empleando un sistema convencional de puntuaciones cuando no existe unidad de medida. 
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e Asignar un rango entre los elementos de la población, es decir, ordenarlos de mejor a peor y una vez ordenados asignar 
un valor a su número de orden. 


Con cualquiera de los tres sistemas se obtienen siempre números que son los valores de la variable de estudio, también 
se les denomina indistintamente, datos u observaciones. Sin embargo, los dos últimos sistemas no son tan objetivos ni tan 
exactos como el primero. Por ejemplo, número de hermanos, notas en un examen, capacidad de resistencia a través del orden 
de llegada en una carrera. 

En cuanto a los atributos, la observación implica obtener en cada elemento la modalidad correspondiente. Los resultados 
se suelen denominar, indistintamente datos u observaciones. 

Resaltemos algunas diferencias importantes entre variables y atributos: Con los valores de una variable la población 
queda ordenada o jerarquizada de forma natural según el orden que nos proporciona el número asignado a cada elemento. 
Sin embargo, con los atributos, esta jerarquización no es posible. 

Una variable puede estudiarse en forma de atributo. Basta con agrupar los valores de la variable en modalidades. Por 
ejemplo, en el atributo color las modalidades pueden ser: rojo, amarillo, morado... 

Después de seleccionar los caracteres que consideramos básicos para la investigación y delimitar la forma de observarlos, 
debemos proceder a la observación del valor sobre los elementos de la población de estudio. Surge ahora un nuevo problema 
relacionado con el tamaño de la población y los recursos disponibles. Lo cual nos va a llevar a considerar dos métodos 
diferentes de observación. 


e Observación exhaustiva: Es la que se realiza cuando podemos observar todos los elementos de la población. En principio 
en que se basa esta observación es sencillo, aunque la ejecución suele ser laboriosa y su coste elevado. 


e Observación parcial: Sólo pueden observarse una parte determinada de la población. Se puede realizar de dos formas. 
Bien observando un estrato u observando una muestra. 


Diremos que hemos observado un estrato o estrato cuando los elementos que la componen reúnen unas características 
especiales que no se presentan en los restantes elementos. 

Se dice que se ha observado una muestra cuando los elementos que la integran no reúnen ninguna característica esencial 
que los distinga de los restantes elementos. 

Si trabajamos sobre una muestra, las conclusiones extraídas sobre esta deberían ser extrapolables al conjunto de la 
población. Cosa que no ocurre si trabajamos sobre una subpoblación. La ventaja de trabajar con subpoblaciones es que 
podemos centrarnos en el estudio de un subconjunto de la población que presenta alguno de los caracteres en los que estamos 
interesados en nuestro estudio. 

En ocasiones puede ser interesante realizar una observación MIXTA de forma que nos centremos en alguna característica 
importante para el estudio mediante subpoblaciones y el resto de características se estudian mediante muestreo. 

Centrándonos en las muestras, el problema surge al intentar que la muestra de elementos seleccionada sea representativa, 
es decir, las conclusiones extraídas sobre la muestra puedan extrapolarse al conjunto de la población como deseamos que 
ocurra. Las preguntas son varias: 


e ¿Cómo seleccionamos la muestra de elementos para que estos resulten representativos? 


e ¿Cuál debe ser el tamaño de la muestra para que esto ocurra? O dicho de otra manera, ¿cuál es el tamaño mínimo 
que ha de tener una muestra para que sea grande la probabilidad de que al sustituir la característica poblacional por 
la muestral el error cometido sea pequeño? 


4 Tipos de muestreo 


Como hemos señalado la muestra es la parte de la población que utilizamos para conocer a toda la población, aunque sea de 
un modo aproximado. Las muestras deben cumplir las siguientes condiciones: 


e Ser representativa: Esta condición está asociada al tamaño de la muestra n, ya que cuanto más grande sea n es evidente 
que más información proporcionará, y por lo tanto, más representativa. Á su vez, el tamaño de la muestra también 
depende de la dispersión ya que, si la población esta muy dispersa, tendremos que coger una muestra de gran tamaño, 
para no perder mucha información. 


e Ser aleatoria: Todos los análisis estadísticos se basan en que la muestra sea aleatoria, es decir, que todos los elementos 
de la población tienen la misma probabilidad de formar parte de la muestra. En caso contrario, corremos el peligro 
de coger una subpoblación, que es un subconjunto de la población que cumple una determinada condición, con lo cual 
perdemos el principio de representatividad. En el caso de que se pierda la aleatoriedad y, por lo tanto la muestra no 
sea del todo representativa, se dice que se han cometido errores de sesgo. Otro fallo a la hora de elegir una muestra es 
que una variable condicione a otra, ya que las variables deben ser independientes y no condicionadas. 
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Para aumentar la representatividad sin necesidad de aumentar el tamaño de la muestra se recurre al muestreo o técnicas de 
muestreo. En la práctica resuelven el problema de la representatividad. Hay varios tipos de muestreo: 


e Muestreo Aleatorio Simple: Se realiza en poblaciones en las que los datos son homogéneos. Es decir, no existen factores 
que produzcan variabilidad sistemática. En este tipo de muestreo los elementosde la población homogénea se eligen al 
azar. 


e Muestreo Aleatorio Estratificado: Si en la población existe variabilidad, este muestreo consiste en descomponer la 
población en partes que se llaman estratos, de manera que dentro de cada estrato los elementos sean homogéneos, 
siendo diferentes los elementos de estratos distintos. Posteriormente se realiza un muestreo aleatorio simple en cada 
estrato, obteniéndose así la muestra. Se deben coger como estratos aquellos factores que producen variabilidad de los 
datos. Por ejemplo, si quisieramos estudiar la altura de los españoles, los criterios de estratificación podría ser: su sexo 
(hombre/mujer), lugar dónde viven (Rural/Urbano) y Edad (Niños, Adultos, Ancianos). La relación entre el tamaño 
de la muestra del estrato y el tamaño del estrato debe ser la misma que la relación entre el tamaño total de la muestra 
y el tamaño de la población. 


e Muestreo por conglomerados: Se aplica cuando la población presenta heterogeneidad y se actúa de la siguiente manera: 


— Paso 1: Se descompone la población en clases llamadas conglomerados, de forma que dentro de cada conglomerado 
haya la máxima dispersión o heterogeneidad (es decir, que haya de todo), de tal forma que los conglomerados se 
parezcan entre sí. 


— Para elegir la muestra se realiza un muestreo aleatorio de conglomerados. Cuando se elige un conglomerado, todos 
los elementos del mismo forman parte de la muestra. 


e Muestreo Sistemático: Se realiza cuando los elementos se encuentran en una lista. Una vez que se elige un número, el 
resto ya está condicionado. Para introducir la aleatoriedad, se dice por donde se empiezan a coger los elementos. Por 
ejemplo, si se quieren seleccionar 25 elementos de 100, se elige aleatoriamente entre los 4 primeros elementos y de ahí 
tomamos los elementos cada 4. 


e Muestreos Polietápicos: se realizan tomando estratos y después aplicando algún muestreo de los anteriores, luego se 
hace otro, etc. Aplicando múltiples etapas. 


Además, todos los tipos de muestreo anteriores pueden ser con reemplazamiento o sin reemplazamiento, según si una vez 
elegido el elemento se devuelve o no a la población. 


5 Estadísticos muestrales 


Los estadísticos son funciones que dependen de los valores de las muestras, hay que saber diferenciarlos de los parámetros 
estadísticos que describen características de toda una población y son el objetivo de muchas inferencias estadísticas para 
tratar de estimarlos a partir de los estadísticos muestrales. 

Distintos estadísticos muestrales: 


e Media: X = 2 )7;_, X;. Se diferencia de la media poblacional (1) en que X es una función y yu es un parámetro. 


e Varianza s? = 177, (2, — 2)? 


e Cuasivarianza $52 = 27 )7_, (2; — 2)? 


e Proporción Muestral. Se define para valores cualitativos donde x=número de casos con cualidad y n=tamaño de la 
T 


muestra. Se define por: 7 
La media muestral puede tomar un conjunto de valores que dependen de las variables X1,X2,..., X”. Los valores que 
puede tomar un estadístico t,,ta,...,t,, forman la población del estadístico. La distribución de frecuencias o de probabilidad 
se llamará distribución del estadístico. 
Por ejemplo, dada la población (1,3,5,7) con fp = 4 y 0? = 5, calcular la distribución del estadístico de X de tamaño 2: 
X= Lita Se toma la muestra con reemplazamiento. 
Valores que puede tomar en el estadístico: 


0 NN RE 
=> 0 N 
OH 
[ASS 


ES 
al 
O 
—I 


La media de las medias muestrales es: uz = App 7 =4 


que coincide con la media de la población. 
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2 = 2.5 que coincide con la varianza de la población 


A 


Si calculamos la varianza de las medias muestrales obtenemos o 
2 a? 


dividida por n(3). Entonces: 02 = 2 

Por lo tanto, la distribución del estadístico X se ajusta a una distribución normal de media y y varianza , 

El Teorema de la normalidad de la muestra afirma que si tienes una población que sigue una distribución normal, 
independientemente de cuál sea la media y la varianza de esa población, cualquier estadístico que calcules a partir de una 
muestra de esa población (como la media muestral ) también seguirá una distribución normal. Además de este teorema se 
deduce que: la media de la media muestral será igual a la media de la población original y la varianza de la media muestral 
será igual a la varianza de la población original dividida por n (tamaño de la muestra). Esto significa que, si tienes una 
población normal y tomas muestras de ella, la media muestral seguirá siendo una variable aleatoria normal cuya media es la 
misma que la de la población original, pero cuya varianza disminuirá a medida que aumente el tamaño de la muestra. 

¿Y qué sucede si la población no tiene una distribución normal o desconocemos cual es su distribución? En este caso 
debemos tener en cuenta el Teorema central del límite que dice que a medida que aumentamos el tamaño de las muestras (n), 
la distribución de los promedios de esas muestras se aproxima cada vez más a una distribución normal, independientemente 
de la forma de la distribución original de la población. Y por lo tanto, con un tamaño de muestra lo suficientemente grande 
volveremos a tener que la media muestral será igual a la media de la población original y la varianza de la media muestral 
será igual a la varianza de la población original dividida por n (tamaño de la muestra). 


6 Estimación 


Una vez que hemos tomado la muestra, nuestro siguiente paso es obtener información sobre los parámetros de la población a 
partir de esta muestra. Para lograrlo, utilizamos estimadores, que son variables aleatorias diseñadas para estimar parámetros 
poblacionales. Estos estimadores se dividen en dos categorías principales: Estimadores Puntuales, que proporcionan un 
único valor para el parámetro poblacional, y Estimadores por Intervalos, que especifican un rango de valores. Es importante 
recordar que para realizar estas estimaciones de manera precisa, la muestra debe ser representativa y seleccionada de manera 
aleatoria, además de tener un tamaño suficiente. 

Para que un estadístico sea considerado un buen estimador de un parámetro dado, conviene que reúna las siguientes 
propiedades: 


e Ser Insesgado (centrado): la esperanza o valor esperado del estimador es igual al valor real del parámetro poblacional 
que se está estimando. Esto significa que, en promedio, el estimador no sobreestima ni subestima el valor del parámetro 
y, por lo tanto, no introduce sesgos sistemáticos en las estimaciones. 


e Ser Consistente: a medida que aumenta el tamaño de la muestra, tiende a converger hacia el valor verdadero del 
parámetro que se está estimando. En otras palabras, a medida que se recopilan más datos, el estimador se vuelve 
cada vez más preciso y se acerca más al valor real del parámetro poblacional. Un estimador consistente no necesita 
ser necesariamente imparcial (centrado), lo que significa que no tiene que dar estimaciones exactas en cada muestra 
individual. Sin embargo, a medida que se toman muestras más grandes, la variabilidad en las estimaciones disminuye 
y el estimador se acerca al valor real del parámetro. 


e Ser Eficiente: debe tener la varianza más baja posible entre todos los estimadores insesgados disponibles para estimar 
el mismo parámetro. Esto significa que, en comparación con otros estimadores insesgados, un estimador eficiente tiene 
la menor dispersión en sus estimaciones. 


e Ser Suficiente: un estimador es suficiente si contiene toda la información que se necesita para hacer una estimación del 
parámetro sin perder información útil. 


6.1 Métodos de estimación puntual 


En este enfoque, intentamos encontrar un número único que represente el valor que queremos conocer de la población. 
Cuando estimamos un parámetro 0 (que es algo que queremos saber), estamos básicamente creando una función a partir de 
la muestra que nos da un valor de 9, f(x1,...,t2,) =0. A esta función se la denomina Estimador y a sus valores Estimaciones 
del Parámetro. Algunos de estos métodos son: 


e Estimación por Máxima Verosimilitud: es un método que utiliza la probabilidad para encontrar el valor del parámetro 
que hace que nuestros resultados observados sean los más probables. Este método se populariza en el Siglo XX con 
Fisher. 


e Método de los Momentos: Este método es quizás el más antiguo para la estimación de parámetros. Consiste en igualar 
un determinado número de momentos teóricos (los más comunes son la media y la varianza) de la distribución de 
población con los correspondientes momentos muestrales para obtener una o varias ecuaciones que, una vez resueltas, 
permiten estimar los parámetros desconocidos de la distribución poblacional. Ejemplo: Muestra n de una distribución 


Tema 58 


exponencial de parámetro A con función de densidad: f(x,A) = Ae747, con x > 0. Entonces como la media teórica 
sería 1/4. Podemos estimar el parámetro A a partir de la media muestral Z. 


e Estimadores Bayesianos: Se incorpora información previa sobre los parámetros desconocidos y se basa en la estadística 
bayesiana. Se proporciona una distribución a priori, se contrasta la verosimilitud de los datos de la muestra y se obtiene 
una distribución a posteriori, a partir de la cual se calcula la estipación puntual. 


6.2 Estimación por intervalos 


Aún el estimador centrado más eficiente es improbable que estime con exactitud el valor del parámetro de la población. De 
aquí nace la necesidad de obtener un intervalo dentro del cual se espera hallar el valor del parámetro, lo que nos lleva a la 
Estimación por Intervalos. Una estimación por intervalos de un parámetro Ó de la población es un intervalo de la forma 

0, <0< Oy 

donde 6. y Oy dependen de las observaciones muestrales. Puesto que muestras diferentes generalmente proporcionarán 
valores diferentes, estos puntos extremos del intervalo son valores aleatorios y se buscan de modo que fijado y entre O y 1 
se verifique que P(0, < 0 < Oy) = y. Este intervalo recibe el nombre de intervalo de confianza. El valor y se denomina 
Coeficiente de Confianza y los valores 0 y By son respectivamente Límite de confianza Inferior y Límite de Confianza 
Superior. 


7 Tamaño de la muestra: El caso de la media poblacional 


Ilustraremos con el estadístico medio muestral, cómo poder determinar si una muestra es suficientemente grande para 
ser representativa. Esta condición depende de que parámetros vayan a estimarse. Así, el objetivo es medir, en términos 
probabilísticos, el error que se comete al sustituir la media poblacional por la media de una muestra elegida aleatoriamente. 
Para ello partimos de que suponemos conocida la cuasi-varianza de la población ($?) y el tamaño de la misma (N), y hemos 
elegido un cierto coeficiente de confianza 1 — > y un margen de error e que consideraremos admisibles. Tras ello buscaremos 
determinar cuál es el tamaño mínimo de la muestra que nos permite determinar con una probabilidad igual a 1 — 2 que el 
error al sustituir la media de la población por la media de cualquier muestra de ese tamaño es menor que e. 

Teorema: Sea P una población de tamaño N y X una variable sobre la población con cuasi-varianza S? conocida y media 
X desconocida. Entonces, para cada par de números reales e > 0 y r > 1, se cumple para todo tamaño de muestra n 

n> N.r?2.5?2 

N-2 412.52 A 

que la probabilidad de que la media muestral se aleje de X más de e es 2. Dicho de otro modo: 

Plliz-X|<e>1- 53 

La demostración del resultado anterior se realiza a través de una aplicación directa de la desigualdad de Tchebichev. 


8 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Dentro de los saberes básicos es el sentido estocástico 
donde se da uso práctico a lo presentado en este tema y que se desarrolla a lo largo de todas las etapas con distintos niveles 
de profundidad. Es uno de los temas más interesantes para trabajar la CEM 6 ya que sus aplicaciones prácticas y cotidianas 
son muy directas y visibles a la hora de poder motivar al alumnado y trabajar obteniendo datos reales de su entorno. 

Por esta aplicación práctica tan directa es una de los contenidos que nos permite trabajar los elementos transversales 
de la ESO (tal como igualdad de género, educación vial, etc) ya que puede servir para analizar y reflexionar sobre la datos 
estadísticos disponibles de estos elementos. 

Será uno de los temas matemáticos que más encontrarán los alumnos en muchas y diversas titulaciones universitarias. 
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1 Introducción: El método estadístico 


La Estadística actual es el resultado de la confluencia de dos disciplinas científicas que, tras evolucionar de modo independiente, 
alumbraron una nueva ciencia en el siglo XIX. Estas disciplinas son el Cálculo de Probabilidades, cuyo origen se remonta al 
siglo XVII, y la "Ciencia del Estado” con raíces más antiguas. 

Con cierta imprecisión se puede definir la Estadística cono una ciencia que estudia cómo obtener, mediante el uso de 
modelos matemáticos, conclusiones de una investigación empírica sobre el comportamiento de un colectivo. Es decir, busca 
las características generales de un grupo a partir de la experimentación y estudio de casos particulares. Sin embargo, el 
objetivo de la estadística no es estudiar el comportamiento de casos aislados, simplemente los usa como medio para estudiar 
el comportamiento del grupo. Las regularidades del grupo total se obtienen tanto mejor cuanto más grande es el grupo 
estudiado. 

El método estadístico se aplica en todos los hechos para los cuales la multiplicidad de sus causas y su complejidad hace 
imposible la utilización de un modelo matemático determinista. Este método estadístico consiste, en esencia, en las siguientes 
fases: 


e Recogida de la documentación relativa a un conjunto de hechos de igual naturaleza (recolección de datos). 


Análisis e interpretación de los datos recogidos 
e Inferencia de propiedades de la población o predicciones futuras a partir de los datos analizados 


La ciencia o parte de la estadística encargada de realizar selecciones adecuadas de los individuos de una población para 
que la recogida de datos referida a la primera fase del proceso se denomina muestreo. 

De la segunda etapa se encarga la denominada estadística descriptiva; no basta con registrar los datos, sino someterlos 
a una crítica inteligente, realizar los cálculos pertinentes asociados a dichos datos y reunir los resultados definitivos tablas 
estadísticas o gráficas para su interpretación. 

La tercera etapa, es la que conecta la estadística con los modelos matemáticos estocásticos. En resumen, la estadística 
descriptiva se ocupa de ordenar y analizar los datos recogidos de un subconjunto de una población y, valiéndonos del cálculo 
de probabilidades, podemos hacer inferencias acerca de esa población. Ordinariamente, dichas inferencias versarán sobre 
los parámetros de la población a partir de las estadísticas de la muestra. También pueden hacerse sobre la forma de la 
distribución. Esto es lo que se denomina inferencia estadística. 


2 Definiciones de términos estadísticos 


Toda investigación estadística debe estar necesariamente referida a un conjunto o colección de personas o cosas que verifiquen 
una definición bien determinada. 

Se llama población a este conjunto o colección. Los objetos o individuos el que componen una población recibían el 
nombre de elementos y pueden tener existencia real o referirse a objetos o conceptos abstractos. Es decir, pueden coincidir 
con unidades naturales o pueden ser creados de forma artificial. El tamaño de una población viene dado por el número de 
elementos que la componen. Dicho tamaño y puede ser finito o infinito. Los elementos de la población presentan ciertas 
propiedades o cualidades a las que llamaremos caracteres. Los caracteres de los elementos que componen una población los 
dividiremos según sean de carácter cuantitativo o cualitativo. 

Los caracteres cuantitativos se denominan variables y son aquellos que pueden describir se de forma numérica. Es decir, 
la observación produce números que son los valores de la variable. Las variables estadísticas asumen pueden dividirse entre 
discretas y continuas (aunque no es una separación total ya que podemos encontrar variables que no son ni totalmente 
discretas ni totalmente continuas). 

Se habla de variables discretas cuando se puede suponer entre dos puntos de la escala de medida existe un número finito 
de valores potenciales de la característica que estamos midiendo. 

Se habla de variables continuas en el presupuesto teórico de que, entre dos puntos cualesquiera de la escala, existe un 
número infinito de valores potenciales de la característica que estamos midiendo. 

Los caracteres cualitativos o, atributos, son los que se describen mediante palabras. Un atributo tiene distintas formas 
de presentación a las que denominaremos modalidades. 


3 Observación de una población. Muestreo. 


La observación de una variable implica la obtención de un número en cada elemento de la población y dicho número puede 
obtenerse de las siguientes maneras: 


e Aplicando la unidad de medida adecuada cuando dicha unidad existe. 


e Empleando un sistema convencional de puntuaciones cuando no existe unidad de medida. 
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e Asignar un rango entre los elementos de la población, es decir, ordenarlos de mejor a peor y una vez ordenados asignar 
un valor a su número de orden. 


Con cualquiera de los tres sistemas se obtienen siempre números que son los valores de la variable de estudio, también 
se les denomina indistintamente, datos u observaciones. Sin embargo, los dos últimos sistemas no son tan objetivos ni tan 
exactos como el primero. Por ejemplo, número de hermanos, notas en un examen, capacidad de resistencia a través del orden 
de llegada en una carrera. 

En cuanto a los atributos, la observación implica obtener en cada elemento la modalidad correspondiente. Los resultados 
se suelen denominar, indistintamente datos u observaciones. 

Resaltemos algunas diferencias importantes entre variables y atributos: Con los valores de una variable la población 
queda ordenada o jerarquizada de forma natural según el orden que nos proporciona el número asignado a cada elemento. 
Sin embargo, con los atributos, esta jerarquización no es posible. 

Una variable puede estudiarse en forma de atributo. Basta con agrupar los valores de la variable en modalidades. Por 
ejemplo, en el atributo color las modalidades pueden ser: rojo, amarillo, morado... 

Después de seleccionar los caracteres que consideramos básicos para la investigación y delimitar la forma de observarlos, 
debemos proceder a la observación del valor sobre los elementos de la población de estudio. Surge ahora un nuevo problema 
relacionado con el tamaño de la población y los recursos disponibles. Lo cual nos va a llevar a considerar dos métodos 
diferentes de observación. 


e Observación exhaustiva: Es la que se realiza cuando podemos observar todos los elementos de la población. En principio 
en que se basa esta observación es sencillo, aunque la ejecución suele ser laboriosa y su coste elevado. 


e Observación parcial: Sólo pueden observarse una parte determinada de la población. Se puede realizar de dos formas. 
Bien observando un estrato u observando una muestra. 


Diremos que hemos observado un estrato o estrato cuando los elementos que la componen reúnen unas características 
especiales que no se presentan en los restantes elementos. 

Se dice que se ha observado una muestra cuando los elementos que la integran no reúnen ninguna característica esencial 
que los distinga de los restantes elementos. 

Si trabajamos sobre una muestra, las conclusiones extraídas sobre esta deberían ser extrapolables al conjunto de la 
población. Cosa que no ocurre si trabajamos sobre una subpoblación. La ventaja de trabajar con subpoblaciones es que 
podemos centrarnos en el estudio de un subconjunto de la población que presenta alguno de los caracteres en los que estamos 
interesados en nuestro estudio. 

En ocasiones puede ser interesante realizar una observación MIXTA de forma que nos centremos en alguna característica 
importante para el estudio mediante subpoblaciones y el resto de características se estudian mediante muestreo. 

Centrándonos en las muestras, el problema surge al intentar que la muestra de elementos seleccionada sea representativa, 
es decir, las conclusiones extraídas sobre la muestra puedan extrapolarse al conjunto de la población como deseamos que 
ocurra. Las preguntas son varias: 


e ¿Cómo seleccionamos la muestra de elementos para que estos resulten representativos? 


e ¿Cuál debe ser el tamaño de la muestra para que esto ocurra? O dicho de otra manera, ¿cuál es el tamaño mínimo 
que ha de tener una muestra para que sea grande la probabilidad de que al sustituir la característica poblacional por 
la muestral el error cometido sea pequeño? 


4 Técnicas de obtención de datos 


La estadística descriptiva se encarga de la recogida, ordenación y tabulación de los datos obtenidos en ciertas observaciones, 
para posteriormente extraer, a partir de los mismos, conclusiones acerca de las características de una población. En 
consecuencia, una primera cuestión a dilucidar es la elección del procedimiento a emplear para la obtención de los datos, con 
el fin de que sean representativos de la población que se pretende estudiar. 

Frecuentemente es imposible disponer de datos de la población entera: por ejemplo si se requieren ensayos destructivos 
como los empleados para evaluar el tiempo que sobreviven cierto tipo de plantas sin ser regadas. Otra razón suele ser que la 
población a estudiar es demasiado numerosa y el coste económico y de tiempo hace inviable el estudio de toda la población, 
por ejemplo si se quiere estudiar cierta característica de todos los habitantes de un país. Es por ello que es imprescindible 
acudir a métodos de muestreo, en el que se selecciona un subconjunto de esa población, denominado muestra, y a partir de 
sus características se pretende inferir las de la población. Para esto último es necesario que la muestra reúna ciertas garantías 
de fiabilidad. Para ello las muestras deben cumplir las siguientes condiciones: 


e Ser representativa: Esta condición está asociada al tamaño de la muestra n, ya que cuanto más grande sea n es evidente 
que más información proporcionará, y por lo tanto, más representativa. Á su vez, el tamaño de la muestra también 
depende de la dispersión ya que, si la población esta muy dispersa, tendremos que coger una muestra de gran tamaño, 
para no perder mucha información. 
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e Ser aleatoria: Todos los análisis estadísticos se basan en que la muestra sea aleatoria, es decir, que todos los elementos 
de la población tienen la misma probabilidad de formar parte de la muestra. En caso contrario, corremos el peligro 
de coger una subpoblación, que es un subconjunto de la población que cumple una determinada condición, con lo cual 
perdemos el principio de representatividad. En el caso de que se pierda la aleatoriedad y, por lo tanto la muestra no 
sea del todo representativa, se dice que se han cometido errores de sesgo. Otro fallo a la hora de elegir una muestra es 
que una variable condicione a otra, ya que las variables deben ser independientes y no condicionadas. 


Para aumentar la representatividad sin necesidad de aumentar el tamaño de la muestra se recurre al muestreo o técnicas de 
muestreo. En la práctica resuelven el problema de la representatividad. Hay varios tipos de muestreo: 


e Muestreo Aleatorio Simple: Se realiza en poblaciones en las que los datos son homogéneos. Es decir, no existen factores 
que produzcan variabilidad sistemática. En este tipo de muestreo los elementos de la población homogénea se eligen al 
azar. 


e Muestreo Aleatorio Estratificado: Si en la población existe variabilidad, este muestreo consiste en descomponer la 
población en partes que se llaman estratos, de manera que dentro de cada estrato los elementos sean homogéneos, 
siendo diferentes los elementos de estratos distintos. Posteriormente se realiza un muestreo aleatorio simple en cada 
estrato, obteniéndose así la muestra. Se deben coger como estratos aquellos factores que producen variabilidad de los 
datos. Por ejemplo, si quisieramos estudiar la altura de los españoles, los criterios de estratificación podría ser: su sexo 
(hombre/mujer), lugar dónde viven (Rural/Urbano) y Edad (Niños, Adultos, Ancianos). La relación entre el tamaño 
de la muestra del estrato y el tamaño del estrato debe ser la misma que la relación entre el tamaño total de la muestra 
y el tamaño de la población. 


e Muestreo por conglomerados: Se aplica cuando la población presenta heterogeneidad y se actúa de la siguiente manera: 


— Paso 1: Se descompone la población en clases llamadas conglomerados, de forma que dentro de cada conglomerado 
haya la máxima dispersión o heterogeneidad (es decir, que haya de todo), de tal forma que los conglomerados se 
parezcan entre sí. 


— Para elegir la muestra se realiza un muestreo aleatorio de conglomerados. Cuando se elige un conglomerado, todos 
los elementos del mismo forman parte de la muestra. 


e Muestreo Sistemático: Se realiza cuando los elementos se encuentran en una lista. Una vez que se elige un número, el 
resto ya está condicionado. Para introducir la aleatoriedad, se dice por donde se empiezan a coger los elementos. Por 
ejemplo, si se quieren seleccionar 25 elementos de 100, se elige aleatoriamente entre los 4 primeros elementos y de ahí 
tomamos los elementos cada 4. 


e Muestreos Polietápicos: se realizan tomando estratos y después aplicando algún muestreo de los anteriores, luego se 
hace otro, etc. Aplicando múltiples etapas. 


Además, todos los tipos de muestreo anteriores pueden ser con reemplazamiento o sin reemplazamiento, según si una vez 
elegido el elemento se devuelve o no a la población. 


5 Estadística descriptiva 


Una vez recogidos los datos sobre la muestra o sobre la población, el siguiente paso es realizar un análisis y descripción de los 
datos. Se trata de resumir adecuadamente la información que la colección de datos contiene para su correcta interpretación. 
En su versión más sencilla esto se realiza por medio de tablas que recogen las frecuencias relativas y absolutas, simples 
o acumuladas, puntuales o por intervalos, de los datos obtenidos, y que van acompañadas de gráficos que las ilustran: 
diagramas de sectores, de barras, polígonos de frecuencias, histogramas,... La mejor o peor adecuación de cada gráfico al 
tipo de característica estudiada depende de la naturaleza de la misma. Se usan representaciones distintas para variables y 
atributos y también hay diferencias entre variables discretas y continuas. Esta es la parte de la estadística descriptia que 
trataremos en este tema. 

También es propio de la Estadística Descriptiva la introducción de los llamados parámetros estadísticos, entre los que 
se suelen distinguir los de centralización, los de dispersión y los de forma. Entre los primeros son esenciales la media, los 
cuartiles y percentiles, especialmente la mediana, y las modas. Todos ellos representan valores “alrededor de los cuales se 
concentran los datos” 

Para saber en qué medida se concentran los datos alrededor de un valor se emplean los momentos, o parámetros de 
dispersión. El más relevante es la varianza, pero también tienen interés el coeficiente de variación de Pearson, que tiene 
carácter relativo (es adimensional) y la mediana de las desviaciones absolutas. 

Los parámetros de forma se emplean para poblaciones grandes y, como su nombre indica, dan cuenta de la forma de las 
gráficas que se emplean para representar los datos. En esencia, reflejan la existencia de simetrías y miden el mayor o menor 


Tema 59 


“aplastamiento” de sus gráficas. De lo primero se encarga el denominado coeficiente de asimetría de Pearson, y de lo segundo 
el parámetro de curtosis. Con frecuencia estos datos proporcionan pistas de la distribución que sigue la población. 

En ocasiones los datos son vectores con, por ejemplo, dos coordenadas. Esto se debe a que para cada elemento de la 
población (de la muestra) observamos dos (o más) variables o atributos diferentes. La Estadística Descriptiva se centra 
entonces en estudiar si existen relaciones funcionales entre los valores de las variables observadas y de ser así decidir cuál 
es la naturaleza de la misma. De ello se ocupa la teoría de la regresión y correlación. El caso básico y más importante es 
el de regresión lineal, que trata de determinar si existe una relación lineal entre dos variables, X e Y, y en caso afirmativo 
determinar los parámetros a, b, de forma que la regresión Y = aX +b se ajusta ”lo mejor posible” a los datos observados 
(minimiza los errores cuadráticos). La existencia de otras relaciones funcionales puede reducirse al estudio de una correlación 
lineal previo cambio de variable: Una relación exponencial del tipo Y = b” - a , puede estudiarse como una relación lineal 
InY =uX +. 


6 Tablas y gráficas 


Las tablas y gráficas estadísticas son formas sencillas de representar frecuencias relativas y absolutas. En este tema nos 
centraremos en describir los métodos gráficos empleados en el caso de series unidimensionales pero comenzaremos por la 
respresentación de los datos en la tabla de frecuencias. Partimos de una serie unidimensional: 

p:A=1,2,..,N>R 

Y suponemos conocidas su imagen Im(p) = 11 < 12<... < tp (los valores posibles a partir de los N elementos), la 
frecuencia absoluta f, = card(p”*(x;)) (el número de elementos que cuya imagen es 2;), y la frecuencia relativa h, = i de 
cada x, € Imp. Se denomina i-ésima frecuencia acumulada absoluta e i-ésima frecuencia acumulada relativa, respectivamente, 
para cada indice ¡tal que 1 << p, a las sumas F; = 7,1 f; y Hi = Dj=1 hy. Por supuesto, F, = N, por lo que H, =1. 
Estos datos se representan como en la siguiente tabla: 


Im(p) Fr. Abs. | Fr. rel. | Frec.ac.abs | Fr.ac.rel. 
T1 fi hi Fi A 
Zi f; hi F; i 
Tp fp hy E HA, 

Suma N 1 


A partir de hi y Hi también se pueden representar los porcentajes simples y acumulados simplemente multiplicando los 
valores por cien. En los atributos las x, representan modalidades, por lo tanto no serán valores numéricos y no se podrá 
realizar cálculos a partir de ellos ni ordenarlos. No tendrán sentido las frecuencias acumuladas y solo podrán calcularse las 
absolutas y relativas. 


6.1 Diagrama sectorial 


Uno de los gráficos más utilizados para representar los datos de la tabla anterior son los diagramas sectoriales. Este diagrama 
utiliza un círculo dividido en sectores para mostrar la proporción o porcentaje que cada categoría representa en un conjunto 


de datos. Para ello se descompone el círculo en sectores cuya áreas cumplen que f, = te = 34, siendo A el área total, A; 


el área de cada sector correspondiente a cada conjunto de datos x; y a; el ángulo i-ésimo sector medido en radianes. Por lo 
tanto, los ángulos de los sectores son proporcionales a las frecuencias relativas. 


/ 


: pa : : A RIA! 
El ejemplo de la figura corresponde al caso p = 5 con frecuencias relativas 7,5, 3, 5Y3p- 


Los diagramas sectoriales constituyen un rápido instrumento de comparación muy útil en numerosos casos. Sin embargo 
hay que tener en cuenta que tanto si p es grande como cuando la frecuencia relativa de uno o varios de los valores de x, es 
muy pequeña pierden su utilidad, pues en tales casos la comparación visual de los tamaños de los sectores es difícil. 

También son útiles para la representación de atributos. 
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6.2 Diagrama de barras y polígono de frecuencias 


Mediante los diagramas de barras se representan tanto las frecuencias absolutas como las relativas. Sobre cada valor de la 
serie se levanta una barra cuya altura, medida con la escala predeterminada que se desee, es la frecuencia absoluta o relativa, 
del valor correspondiente. 

Tomemos como ejemplo la siguiente tabla de frecuencias: 


xi | Fr. Abs. 
1 3 
Ta 2 
3 3 
Ta 4 


El diagrama de barras asociado será el siguiente: 


Uniendo mediante segmentos rectilíneos los extremos superiores de las barras se obtiene el denominado polígono de 
frecuencias. El asociado al diagrama de barras anterior viene dado por el siguiente gráfico: 


TAS 


Con frecuencia, los diagramas de barras son empleados para comparar las frecuencias de diversos valores de Im(p) 
correspondientes a distintas épocas. Para facilitar la comparación es preferible la representación conjunta de ambos, 
distinguiendo la época por la trama de cada barra tal y como muestra el diagrama de barras siguiente: 


[a] 


MA 2004 
MU 2003 


RNO0Oyq4asca 


%, Z, 1 


Estos diagramas se pueden usar para atributos pero hay que tener en cuenta que al representarlo estamos dando un orden 
de manera implícita. 


6.3 Pictogramas 


Los pictogramas son bastante interesantes para la representación de atributos. Existen 2 tipos: 


e Tipo I:Cada modalidad es representada por un dibujo de tamaño proporcional a la frecuencia de la misma. Si el dibujo 
es representado en tres dimensiones, será el volumen el que nos represente a la frecuencia. De igual forma, si el dibujo 
es representado en el plano, será el área la que represente a la frecuencia. 


360 400 100 1580 


SOLTEROS CASADOS SEP/DIV VIUDOS 


Tema 59 


e Tipo II: Todos los dibujos son del mismo tamaño y a cada uno de ellos se le asigna una cantidad de frecuencia. A cada 
modalidad se le asignan tantos dibujos, o partes del mismo, según la frecuencia a representar. 


Pictograma para el Estado Civil 


ESTADO CIVIL 


6.4 Agrupación por intervalos 


En algunos casos la agrupación de los datos en intervalos facilita su interpretación. Si se pretende hacer esto sin perder 
información se puede recurrir a los llamado diagramas de tallo y hojas. Ilustremos en qué consiste este procedimiento 
mediante un ejemplo. Supongamos que: 

Im(p) = (15; 16; 21; 23; 23; 26; 26; 30; 32; 41) 

Podemos agrupar los datos anteriores por decenas, es decir en intervalos de amplitud 10. La de la derecha recoge las 
cifras de unidades de todos aquellos datos que comparten el número de decenas y dicho número está a su izquierda. Así la 
tabla adjunta recoge los datos con toda precisión, pero en un solo golpe de vista permite apreciar la prevalencia de los datos 
que se encuentran en la veintena, y que tanto en la decena como la treintena hay el mismo número de datos. Se dice que la 
columna de la izquierda constituye el tallo del diagrama y la de la derecha sus hojas. 


15,16,21, 23,23, 26, 26,32, 41 


Tallo Hoja 
1 56 
2 1 A 
C 
3) «0 colocar 
4 1 19” 


La agrupación por intervalos es especialmente interesante cunado p es muy grande y apenas se presenten repeticiones, 
por ejemplos cuando « es inyectiva. En tal caso, los diagramas de barras como de sectores carecen de interés ya que nos 
encontraremos multitud de barras o sectores iguales. Sin embargo, una adecuada agrupación de los datos puede aportar 
información relevante. También puede darse que no se disponga de información precisa acerca de la serie p, y que se conozca 
solamente una partición de intervalos disjuntos de un intervalo que contiene a la imagen. Esto sucede habitualmente cuando 
la toma de datos conlleva el uso de un instrumento de medida que comete errores, por lo que sólo se pude asegurar que los 
valores medidos pertenecen a un intervalo. Por una causa u otra, para obtener una representación gráfica adecuada conviene 
en estos casos agrupar los datos de modo que Im(p) C [u1, up+1] y descomponer este intervalo en unión disjunta de intervalos 
de la forma: 

(Li = (ui, 0441) :1<4<p—1jU(L = [Up, Upy1]) 

a los que se llama intervalos de clase, cuyas frecuencias absolutas f, = card((”*(1;)) se suponen conocidas. Se llama 
frecuencia relativa del intervalo f; al cociente h; = L. Y de la misma manera que antes se define la frecuencia acumulada 
absoluta y relativa i-ósima, respectivamente, como: F, =j=1 f; y Hi = Dj=1 hj- 

A partir de aquí se podrían construir diagramas sectoriales, de modo que el ángulo del sector i-ésimo sea proporcional a 
la frecuencia relativa del intervalo /;. El problema es que como los intervalos no son necesariamente de la misma amplitud, 
perderíamos esta información. Esto se corrige mediante los histogramas de frecuencias, de los que los diagramas de barras se 
constituyen como caso particular. En este caso, denotando a; la amplitud de /;, se levanta sobre él un rectángulo cuya área 
es su frecuencia absoluta f;. De este modo la altura del i-ésimo rectángulo vale y, = f,/a; y a diferencia de los que sucede en 
los diagramas de barras, no es necesariamente mayor la del rectángulo construido sobre el intervalo de mayor frecuencia. 

Por ejemplo, el histograma de la figura corresponde a una serie unidimensional p definida en el conjunto [re N:1< 
x < 1000), cuya imagen está contenida en el intervalo [0,6], que es una unión disjunta de los intervalos f, = [0,1), 2 = 
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[1,3)el3 = [3,6] y cumple que card(py”*(I3)(= card(p7*+(1,)) = 300 y card(p”*(12)) = 400. De este modo las alturas de los 
rectángulos son y; = 300, y2 = 200 e y3 = 100. 

El polígono de frecuencias asociado a un histograma es el que tiene por vértices los puntos (x;,y;), 1 <i< p, donde cada 
Li= mp que es el punto medio del intervalo /;, también llamado marca de clase. La marca de clase es el valor empleado 
para calcular distintos parámetros estadísticos. 


7 Tendenciosidad y errores más comunes 


En la primera sección hemos señalado que los estudios estadísticos tienen por objetivo inferir características de una población 
a partir del análisis de sus muestras y para ello es imprescindible que las muestras sean representativas y la selección de los 
individuos que las componen aleatoria. El incumplimiento de estas condiciones es frecuente en algunos trabajos. Por ejemplo, 
no se construye una muestra fiable recogiendo datos al parar en cierta calle a las personas que pasen por allí. El barrio al 
que pertenece esa calle, incluso la hora a la que se recogen los datos puede conllevar que la muestra no sea representativa de 
la población de esa ciudad. Incluso puede verse influenciada por las características de los propios encuestadores que pueden 
animar a cierto perfil a contestar más y a otros a negarse a contestar. Los errores que provienen de una defectuosa selección 
de la muestra, tendenciosa o no, se denominan errores en la obtención de datos. 

Ya hemos visto que a veces la propia obtención de los datos obliga a agrupar los valores de la serie en intervalos: 
[I, :1<:1< pj. Si dos de estos intervalos se cortan o su unión no contiene a la imagen de la serie se comete, desde luego, un 
error. Otro más sútil se puede producir, tal vez deliberadamente, al elegir la partición de Im(p). Si no se impone que todos 
los intervalos que la constituyen tengan la misma amplitud existen infinitas particiones y éstas pueden dar lugar a resultados 
muy diferentes. Consideremos por ejemplo una serie: 

p:A=f4rXEN:1<i<p>R 

que toma los valores 2, = 0, 13 = 0,99, 13 = 1,5, 14 =2,01 y 25 = 3, con frecuencias card/p”*(x1)) = card(p*(x25)) = 4; 
card(p”*(x2)) = card(p”*(x4)) = 20; card(p”*(23)) = 2. 

Sean £ = 2,02 y las particiones (11, 12, 13) y (31, Ja, J3) del intervalo [0, 3] definidas por 

Í¡ = [0, 1), La > [1,2), £3 > (2,3); 4 > [0, 22), Ja a [22, E), J3 = [€, 3); 

En consecuencia, card(p”*(1,)) = 24,card(p”*(12)) = 2,card(p”*(I3)) = 24,card(y”*(J,)) = 4,card(y(J2)) = 
42, card(py”*(J3)) = 4, lo que da lugar a dos histogramas bien distintos: 


Evidentemente, presentar los datos mediante el segundo de estos histogramas desvirtúa la realidad. Se dice entonces que 
se ha cometido un error, tendencioso o no, en la presentación de los datos. 

Tanto en gráficos de barras como de polígonos como histogramas también suele suceder la selección de escalas en el 
eje vertical o no comenzar por el valor O para enfatizar más un aspecto u otro de los datos. Los gráficos presentados a 
continuación representan ambos los siguiente valores: 


Enero | Febrero | Marzo | Abril | Mayo | Junio 
1,25€ — 1,266 | 1,296 | 1,32€ | 1,338 | 1,35€ 


El polígono de frecuencias de la derecha se puede utilizar si se quiere resaltar el incremento de la frecuencia, mientras que 
el gráfico de la derecha se puede utilizar si se pretende ocultar tal incremento, puesto que en el gráfico a penas se nota. 
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Se representan la situación en dos gráficos de línea: 
1,36 € 1,50 € 
1,34 € == 
1,32 € 1,00 € 
1,30 € 
1,28 € 0,50 € 
1,26 € 


1,24€ 


y 9 


O O E TES SEE O 
SEO AS E 


La tendenciosidad de los datos en estadística se refiere a la presencia de un sesgo sistemático en la distribución de los 
valores que se aparta de la distribución esperada o teórica. Este sesgo puede manifestarse como una inclinación hacia un 
valor particular o una dirección en los datos observados. Como hemos visto esta tendenciosidad puede darse en la selección 
de muestras y/o en la representación de datos. La detección y corrección de la tendenciosidad en los datos son importantes 
en estadística para garantizar que las conclusiones y decisiones basadas en esos datos sean válidas y representativas de la 
población o fenómeno en estudio. 


8 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Dentro de los saberes básicos es el sentido estocástico 
donde se da uso práctico a lo presentado en este tema y que se desarrolla a lo largo de todas las etapas con distintos niveles 
de profundidad. Es uno de los temas más interesantes para trabajar la CEM 6 ya que sus aplicaciones prácticas y cotidianas 
son muy directas y visibles a la hora de poder motivar al alumnado y trabajar obteniendo datos reales de su entorno. 

Por esta aplicación práctica tan directa es una de los contenidos que nos permite trabajar los elementos transversales 
de la ESO (tal como igualdad de género, educación vial, etc) ya que puede servir para analizar y reflexionar sobre la datos 
estadísticos disponibles de estos elementos. 

Será uno de los temas matemáticos que más encontrarán los alumnos en muchas y diversas titulaciones universitarias. 
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1 Introducción: El método estadístico 


La Estadística actual es el resultado de la confluencia de dos disciplinas científicas que, tras evolucionar de modo independiente, 
alumbraron una nueva ciencia en el siglo XIX. Estas disciplinas son el Cálculo de Probabilidades, cuyo origen se remonta al 
siglo XVII, y la "Ciencia del Estado” con raíces más antiguas. 

Con cierta imprecisión se puede definir la Estadística cono una ciencia que estudia cómo obtener, mediante el uso de 
modelos matemáticos, conclusiones de una investigación empírica sobre el comportamiento de un colectivo. Es decir, busca 
las características generales de un grupo a partir de la experimentación y estudio de casos particulares. Sin embargo, el 
objetivo de la estadística no es estudiar el comportamiento de casos aislados, simplemente los usa como medio para estudiar 
el comportamiento del grupo. Las regularidades del grupo total se obtienen tanto mejor cuanto más grande es el grupo 
estudiado. 

El método estadístico se aplica en todos los hechos para los cuales la multiplicidad de sus causas y su complejidad hace 
imposible la utilización de un modelo matemático determinista. Este método estadístico consiste, en esencia, en las siguientes 
fases: 


e Recogida de la documentación relativa a un conjunto de hechos de igual naturaleza (recolección de datos). 


Análisis e interpretación de los datos recogidos 
e Inferencia de propiedades de la población o predicciones futuras a partir de los datos analizados 


La ciencia o parte de la estadística encargada de realizar selecciones adecuadas de los individuos de una población para 
que la recogida de datos referida a la primera fase del proceso se denomina muestreo. 

De la segunda etapa se encarga la denominada estadística descriptiva; no basta con registrar los datos, sino someterlos 
a una crítica inteligente, realizar los cálculos pertinentes asociados a dichos datos y reunir los resultados definitivos tablas 
estadísticas o gráficas para su interpretación. 

La tercera etapa, es la que conecta la estadística con los modelos matemáticos estocásticos. En resumen, la estadística 
descriptiva se ocupa de ordenar y analizar los datos recogidos de un subconjunto de una población y, valiéndonos del cálculo 
de probabilidades, podemos hacer inferencias acerca de esa población. Ordinariamente, dichas inferencias versarán sobre 
los parámetros de la población a partir de las estadísticas de la muestra. También pueden hacerse sobre la forma de la 
distribución. Esto es lo que se denomina inferencia estadística. 


2 Definiciones de términos estadísticos 


Toda investigación estadística debe estar necesariamente referida a un conjunto o colección de personas o cosas que verifiquen 
una definición bien determinada. 

Se llama población a este conjunto o colección. Los objetos o individuos el que componen una población recibían el 
nombre de elementos y pueden tener existencia real o referirse a objetos o conceptos abstractos. Es decir, pueden coincidir 
con unidades naturales o pueden ser creados de forma artificial. El tamaño de una población viene dado por el número de 
elementos que la componen. Dicho tamaño y puede ser finito o infinito. Los elementos de la población presentan ciertas 
propiedades o cualidades a las que llamaremos caracteres. Los caracteres de los elementos que componen una población los 
dividiremos según sean de carácter cuantitativo o cualitativo. 

Los caracteres cuantitativos se denominan variables y son aquellos que pueden describir se de forma numérica. Es decir, 
la observación produce números que son los valores de la variable. Las variables estadísticas asumen pueden dividirse entre 
discretas y continuas (aunque no es una separación total ya que podemos encontrar variables que no son ni totalmente 
discretas ni totalmente continuas). 

Se habla de variables discretas cuando se puede suponer entre dos puntos de la escala de medida existe un número finito 
de valores potenciales de la característica que estamos midiendo. 

Se habla de variables continuas en el presupuesto teórico de que, entre dos puntos cualesquiera de la escala, existe un 
número infinito de valores potenciales de la característica que estamos midiendo. 

Los caracteres cualitativos o, atributos, son los que se describen mediante palabras. Un atributo tiene distintas formas 
de presentación a las que denominaremos modalidades. 


3 Observación de una población. Muestreo. 


La observación de una variable implica la obtención de un número en cada elemento de la población y dicho número puede 
obtenerse de las siguientes maneras: 


e Aplicando la unidad de medida adecuada cuando dicha unidad existe. 


e Empleando un sistema convencional de puntuaciones cuando no existe unidad de medida. 


Tema 60 


e Asignar un rango entre los elementos de la población, es decir, ordenarlos de mejor a peor y una vez ordenados asignar 
un valor a su número de orden. 


Con cualquiera de los tres sistemas se obtienen siempre números que son los valores de la variable de estudio, también 
se les denomina indistintamente, datos u observaciones. Sin embargo, los dos últimos sistemas no son tan objetivos ni tan 
exactos como el primero. Por ejemplo, número de hermanos, notas en un examen, capacidad de resistencia a través del orden 
de llegada en una carrera. 

En cuanto a los atributos, la observación implica obtener en cada elemento la modalidad correspondiente. Los resultados 
se suelen denominar, indistintamente datos u observaciones. 

Resaltemos algunas diferencias importantes entre variables y atributos: Con los valores de una variable la población 
queda ordenada o jerarquizada de forma natural según el orden que nos proporciona el número asignado a cada elemento. 
Sin embargo, con los atributos, esta jerarquización no es posible. 

Una variable puede estudiarse en forma de atributo. Basta con agrupar los valores de la variable en modalidades. Por 
ejemplo, en el atributo color las modalidades pueden ser: rojo, amarillo, morado... 

Después de seleccionar los caracteres que consideramos básicos para la investigación y delimitar la forma de observarlos, 
debemos proceder a la observación del valor sobre los elementos de la población de estudio. Surge ahora un nuevo problema 
relacionado con el tamaño de la población y los recursos disponibles. Lo cual nos va a llevar a considerar dos métodos 
diferentes de observación. 


e Observación exhaustiva: Es la que se realiza cuando podemos observar todos los elementos de la población. En principio 
en que se basa esta observación es sencillo, aunque la ejecución suele ser laboriosa y su coste elevado. 


e Observación parcial: Sólo pueden observarse una parte determinada de la población. Se puede realizar de dos formas. 
Bien observando un estrato u observando una muestra. 


Diremos que hemos observado un estrato o estrato cuando los elementos que la componen reúnen unas características 
especiales que no se presentan en los restantes elementos. 

Se dice que se ha observado una muestra cuando los elementos que la integran no reúnen ninguna característica esencial 
que los distinga de los restantes elementos. 

Si trabajamos sobre una muestra, las conclusiones extraídas sobre esta deberían ser extrapolables al conjunto de la 
población. Cosa que no ocurre si trabajamos sobre una subpoblación. La ventaja de trabajar con subpoblaciones es que 
podemos centrarnos en el estudio de un subconjunto de la población que presenta alguno de los caracteres en los que estamos 
interesados en nuestro estudio. 

En ocasiones puede ser interesante realizar una observación MIXTA de forma que nos centremos en alguna característica 
importante para el estudio mediante subpoblaciones y el resto de características se estudian mediante muestreo. 

Centrándonos en las muestras, el problema surge al intentar que la muestra de elementos seleccionada sea representativa, 
es decir, las conclusiones extraídas sobre la muestra puedan extrapolarse al conjunto de la población como deseamos que 
ocurra. Las preguntas son varias: 


e ¿Cómo seleccionamos la muestra de elementos para que estos resulten representativos? 


e ¿Cuál debe ser el tamaño de la muestra para que esto ocurra? O dicho de otra manera, ¿cuál es el tamaño mínimo 
que ha de tener una muestra para que sea grande la probabilidad de que al sustituir la característica poblacional por 
la muestral el error cometido sea pequeño? 


La respuesta a la primera pregunta es, que si queremos que la muestra sea representativa y poder usar el cálculo de 
probabilidades cada miembro de la población debe tener la misma probabilidad de formar parte de la muestra y, en la 
extracción de cada individuo, la composición de la población debe ser idéntica. Aparece en este caso, el muestreo aleatorio 
simple. Debido a la imposibilidad de llevarlo siempre a la práctica y para ajustarse a las características de ciertas poblaciones 
aparecen otros tipos de muestreo como el estratificado o por conglomerados. El muestreo no es el concepto central del tema 
que nos ocupa así que no entraremos a detallar estas técnicas de muestreo. 


4 Estadística descriptiva 


Una vez recogidos los datos sobre la muestra o sobre la población, el siguiente paso es realizar un análisis y descripción de los 
datos. Se trata de resumir adecuadamente la información que la colección de datos contiene para su correcta interpretación. 
En su versión más sencilla esto se realiza por medio de tablas que recogen las frecuencias relativas y absolutas, simples 
o acumuladas, puntuales o por intervalos, de los datos obtenidos, y que van acompañadas de gráficos que las ilustran: 
diagramas de sectores, de barras, polígonos de frecuencias, histogramas,... La mejor o peor adecuación de cada gráfico al 
tipo de característica estudiada depende de la naturaleza de la misma. Se usan representaciones distintas para variables y 
atributos y también hay diferencias entre variables discretas y continuas. 
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También es propio de la Estadística Descriptiva la introducción de los llamados parámetros estadísticos, entre los que 
se suelen distinguir los de centralización, los de dispersión y los de forma. Entre los primeros son esenciales la media, los 
cuartiles y percentiles, especialmente la mediana, y las modas. Todos ellos representan valores “alrededor de los cuales se 
concentran los datos” 

Para saber en qué medida se concentran los datos alrededor de un valor se emplean los momentos, o parámetros de 
dispersión. El más relevante es la varianza, pero también tienen interés el coeficiente de variación de Pearson, que tiene 
carácter relativo (es adimensional) y la mediana de las desviaciones absolutas. 

Los parámetros de forma se emplean para poblaciones grandes y, como su nombre indica, dan cuenta de la forma de las 
gráficas que se emplean para representar los datos. En esencia, reflejan la existencia de simetrías y miden el mayor o menor 
“aplastamiento” de sus gráficas. De lo primero se encarga el denominado coeficiente de asimetría de Pearson, y de lo segundo 
el parámetro de curtosis. Con frecuencia estos datos proporcionan pistas de la distribución que sigue la población. 

En ocasiones los datos son vectores con, por ejemplo, dos coordenadas. Esto se debe a que para cada elemento de la 
población (de la muestra) observamos dos (o más) variables o atributos diferentes. La Estadística Descriptiva se centra 
entonces en estudiar si existen relaciones funcionales entre los valores de las variables observadas y de ser así decidir cuál 
es la naturaleza de la misma. De ello se ocupa la teoría de la regresión y correlación. El caso básico y más importante es 
el de regresión lineal, que trata de determinar si existe una relación lineal entre dos variables, X e Y, y en caso afirmativo 
determinar los parámetros a, b, de forma que la regresión Y = aX + b se ajusta ”lo mejor posible” a los datos observados 
(minimiza los errores cuadráticos). La existencia de otras relaciones funcionales puede reducirse al estudio de una correlación 
lineal previo cambio de variable: Una relación exponencial del tipo Y = b” - a , puede estudiarse como una relación lineal 
InY =uX +. 


5 Definiciones 


Vamos a estudiar las series unidimensionales: p: A=1,2,..,N =>R 

Y suponemos conocidas su imagen Im(p) = 11 < x2<... < 2, (los valores posibles a partir de los N elementos), la 
frecuencia absoluta f, = card(p”*(x;)) (el número de elementos que cuya imagen es 2;), y la frecuencia relativa h, = 5 de 
cada x, € Imp. Se denomina i-ésima frecuencia acumulada absoluta e i-ésima frecuencia acumulada relativa, respectivamente, 
para cada indice ¡ tal que 1 << p, a las sumas F; = 7-1 f; y Hi = Dj=1 hy. Por supuesto, F, = N, por lo que H, =1. 
Estos datos se pueden representar como en la siguiente tabla: 


Im(p) Fr. Abs. | Fr. rel. | Frec.ac.abs | Fr.ac.rel. 
21 fi ha Ey HH; 
Zi f: hi F; i 
Tp fp hp Ep H» 
Suma N 1 


A partir de hi y Hi también se pueden representar los porcentajes simples y acumulados simplemente multiplicando los 
valores por cien. En los atributos las 1, representan modalidades, por lo tanto no serán valores numéricos y no se podrá 
realizar cálculos a partir de ellos ni ordenarlos. No tendrán sentido las frecuencias acumuladas y solo podrán calcularse las 
absolutas y relativas. 


6 Medidas de posición 


Las medidas de posición son valores que están medidos en las mismas unidades que las observaciones, y nos indican en torno 
a qué posición se distribuyen los datos. Se clasifican en medidas de posición central (media, mediana y moda) y medidas de 
posición no central (cuartiles, deciles y percentiles). 


6.1 Media aritmética 


Llamamos media aritmética de una serie de n valores 1,12,.., 1, afectados por sus correspondientes frecuencias absolutas 
fi, f2,.., fn (donde D;_, f; = N) a la siguiente expresión: 
Dir titi 

N 

Cuando la variable estadística es continua y está dividida en intervalos se realiza la media aritmética de las marcas de 
clase de cada intervalo ponderadas con sus correspondientes frecuencias. Á su vez estas marcas de clase se calculan mediando 
el límite inferior y superior del intervalo. 

En ocasiones, la ponderación otorgada es distinta de la frecuencia y mide el grado de importancia que se le otorga a cada 
valor. Si w, son las ponderaciones definimos la media ponderada como: 


x= 
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To = "STR, ws 


A continuación describimos algunas propiedades de la media aritmética: 


e La suma de las desviaciones de los valores de la variable respecto de la media es 0, es decir, D7;_, (2; — 2) + f, =0. 
Demostración: (02): fi =D 0: fi 2: 1 fi =8:n-7:n=0 


e Cambio de origen, escala o unidad en la variable lo provoca también en la media. Ear +b) = aE(X) +b. Esta 
propiedad nos permite hacer un cálculo abreviado de la media cuando la distribución presenta numerosos valores o 
están compuestos por bastantes dígitos. 


Demostración: 2= 4D: fi= FDO la UD) =D a ati ofi =a0 +b 


e La media es recursiva, es decir si añadimos un nuevo dato 21,+1 con frecuencia absoluta f. +1, la nueva media 1” se 


puede recalcular a partir del anterior 2: 
ta n Tn+1 


NON 


. no n+1 A 
Siendo N' =>, fi 
Encontramos las siguientes ventajas e inconvenientes: 


e Ventajas: Perfectamente determinada de forma objetiva y clara. Tiene un significado interpretativo muy claro y sencilla 
de calcular. Se usan para el cálculo todos los valores de los que se disponen en la distribución. 


e Inconvenientes: Los valores extremos muy dispares influyen notablemente en su valor a causa de lo cuál puede perder 
valor representativo 


6.2 Media geométrica 


Muchas veces los valores de la distribución no son propiamente aditivos, la media aritmética deja de ser fácilmente interpretable, 
se estudia entonces la media geométrica. Por ejemplo la media geométrica se puede utilizar para calcular promedios en 
situaciones donde los valores están sujetos a tasas de crecimiento o decrecimiento exponenciales, como en el caso de las 


poblaciones biológicas. 
G= Nat «ar con 0) 


En datos agrupados por intervalos se tomaría la marca de clase. Las ventajas son similares a la media aritmética mejorando 
con respecto a ésta en que los valores extremos tienen menos influencia y empeorando la dificultad de calcularla. Además, se 
añade la limitación de que x; > 0. 

Podemos calcularlo de manera más sencilla si tomamos logaritmos: 


in(G) = DN - In(=;) 


6.3 Media armónica 


La media armónica tiende a dar más peso a los valores más cercanos a cero en el conjunto de datos y, por lo tanto, puede ser 
una medida apropiada en situaciones donde los valores bajos son relevantes. Se define como: 


n 
i=1 2; 


Las ventajas son similares a la media aritmética con la diferencia que, como hemos indicado, aquí influyen más los valores 
más cercanos a cero, y no puede usarse si alguno de ellos es 0. 


6.4 Mediana 


Me, valor de la variable que divide a la serie estadística ordenada en dos partes iguales. Si los datos no están agrupados y 
están numerados de l a N, el valor que ocupa el lugar NA si N es impar y la media de los valores que ocupan las posiciones 
Ly +1siN es par. 

A partir de las tablas de frecuencia se puede calcular a partir de las frecuencias acumuladas relativas. Me = x¿|H, > 


0.5 A H;-1 < 0.5, en caso de que H; =0.5 > Me = Ln 


Si los datos están agrupados en intervalos se calcula: 


(0.5— H;_1)-a 
Me = NAAA + 0, 1H, > 0.5 H;-1 <0.5 
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Siendo U,, el extremo inferior del intervalo y a la amplitud. 

Sus ventajas es que es sencillo de calcular y no influyen en ella más que los datos centrales de la distribución, además es 
fácil de interpretar al ser un valor propio de la variable. Como inconveniente la fórmula matemática para expresarla no es 
sencilla. 


6.5 Moda 


Mo, valor o valores de la variable al que corresponde mayor frecuencia. El cálculo es sencillo en los casos de datos simples. 
En el caso de que haya más de un valor con la máxima frecuencia se dice que la variable es bimodal, trimodal... 
Sin embargo cuando están agrupados en intervalos, el intervalo con mayor frecuencia absoluta será el intervalo modal. 
La principal ventaja es que es fácil de calcular y de interpretar. Sin embargo, como inconvenientes, no existe una expresión 
matemática sencilla para el cálculo algebraico, no intervienen todos los valores de la distribución, los cambios que se produzcan 
ajenos al valor modal no son detectados. 


6.6 Percentiles y cuartiles 


Percentil de orden r, P,., es el valor de la variable tal que las frecuencias absolutas de los valores menores o iguales que él se 

representa el r% de la frecuencia total N. Su cálculo es análogo al de la mediana: 

(r/100 as H;-1) :Q 
HA; =H;-1 


Pri= | Up|H; > r/1004 H;-1 < r/100 

Los cuartiles, y la mediana, son casos particulares de los percentiles: Q1 (Pas), Q2(Pso) = Me, Q3(Pz5) 

Los cuartiles son los tres valores que dividen un conjunto de datos ordenados en cuatro partes porcentualmente iguales. 
Aparecen citados en la literatura científica por primera vez en 1879 por D. McAlister. 


6.7 Relación entre media, mediana y moda 


En el caso de distribuciones unimodales los más frecuente es que la mediana esté entre la moda y la media. Si la distribución 
es simétrica y unimodal, las tres coinciden. 
Para distribuciones moderadamente asimétricas se cumple la siguiente desigualdad: |1 — Mo¿| < 3|z — Mo! 


7 Medidas de dispersión 


Las medidas calculadas con anterioridad sirven para resumir la distribución de frecuencias en un solo valor. Las medidas de 
dispersión, tiene como propósito estudiar lo concentrada que está la distribución en torno al valor promedio. Por ejemplo dos 
exámenes de 5 la media es 5 y la dispersión nula, un examen de 0 y otro de 10 su media es la misma, 5, pero la dispersión 
es máxima. 


7.1 Recorrido 


Diferencia entre el mayor y el menor de los valores de la variable. También puede calcularse el recorrido intercuártico, la 
diferencia entre el primer y tercer cuartil. 

Ventajas: Su cálculo es muy sencillo, invariante a los cambios de localización, interpretación sencilla y siempre existe, se 
suele incluir en todas las calculadoras. 

Desventajas: para su cálculo solo intervienen dos datos, y no dependen de los demás por lo que la información que 
proporciona es muy sesgada. 


7.2 Desviaciones 


Con respecto al valor central, c, se calcula la desviación media: 
ml n , ] 
D= Fw Dia Ivi: 


c puede tomar cualquier valor central: media, moda o mediana. 
7.3 Varianza y desviación típica 
La varianza de una distribución de frecuencias es la media aritmética de los cuadrados de las deviaciones respecto a la media, 
2_ 1 ym 5 y2 
0= 7 ja (ni 2) fi 


Su cálculo abreviado es: gw — 2? La desviación típica es la raíz cuadrado de la varianza. La desviación típica 
no tiene un sentido muy concreto en sí misma y tiene significado solo para comparar dos distribuciones. 


n 


2D tida 
= N 
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Cumple las siguientes propiedades 


e Para distribuciones simétricas, o moderadamente asimétricas, se cumple aproximadamente que entre E — 0 y T+0, 
están el 68% de las observaciones y entre Z — 20 y 1 +20 el 98%. 


e Teorema de Kóning: La media de las desviaciones al cuadrado de los valores de la variable respecto a una constante 
g p 
. o. . . . ji? . n en 
K cualquiera se hace mínima cuando esa constante es igual a le media aritmética, es decir = ica 1? -f< 
z (1, — k)? - f¡Vk Para demostrarlo hay que encontrar el valor de esa constante K que amule la primera derivada 


y haga que la segunda sea positiva. 
n 


50 = Ple men 
5) == Y ln—0-11=0 
El 0-0 

Ea HN y, 
z=k e 


Y si aplicamos la segunda derivada el valor siempre es positivo para S(k). 


Sus principales ventajas es que se define de manera objetiva y usa todas las observaciones, además se presta fácilmente 
al cálculo algebraico. Como inconvenientes tenemos que es más sensible que la media a los valores extremos, puesto que 
intervienen al cuadrado. Su cálculo puede ser pesado por lo que a veces se prefiere el recorrido. 


7.4 Coeficiente de variación de Pearson 


Sirve para comparar la calidad de las medias de distintas distribuciones: 

CV =é¿ 

Su principal ventaja es que no se ve afectado por los cambios de escala, sin embargo puede ser negativo o no definido si 
T es 0, se suele utilizar solo para datos positivos. 


7.5 Momentos 


De orden r con respecto al valor c: 

mp =$ la Ye 

Si c = E se denominan 1, podemos comprobar que esta es la generalización de la varianza (con r=2 y c= E, pa) y la 
media (con r=1 y c=0, m1) que son casos particulares. 

Los momentos son muy importantes para definir las medidas de asimetría y curtosis. 


8 Medidas de asimetría y curtosis 


La asimetría de una distribución hace referencia al grado en que los datos se reparten por encima y por debajo de la tendencia 
central. 


e Una distribución es simétrica si el número de datos es similar tanto en los valores inferiores como superiores a la media. 
En términos de probabilidad, esto se expresa como: p(1 < 2) = p(x > 2) 


e Asimetría a la izquierda (sesgo negativo): Ocurre cuando hay más datos en los valores inferiores a la media que en los 
valores superiores. En términos de probabilidad, se cumple que: p(x < 2) >> plz > 2) 


e Asimetría a la derecha (sesgo positivo): Sucede cuando hay más datos en los valores superiores a la media que en los 
valores inferiores. En términos de probabilidad, se cumple que: p(x < 2) << pla > 1) 
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Sesgo = 0 Sesgo < 0 Sesgo > 0 


Para medir cuantitativamente la asimetría se podría utilizar la diferencia de los valores con la media, pero no es posible 
pues hemos visto que el valor siempre es cero. Si utilizamos las diferencias al cuadrado tampoco nos da la información deseada 
pues al ser todas positivas no reflejaría la compensación que caracteriza la simetría. Se usa por tanto el índice de Pearson o 
Fisher. 


e Pearson: En distribuciones unimodales y simétricas (o con una asimetría específica) la mediana está entre la moda y 
la media. M, < M.< 161 < M. < M, Pearson define su índice de simetría tal que 


z— Mo 
d 


fi = 


en el cual si f¡ = 0 es simétrica, si f, > O es asimétrica a derecha y de lo contrario a izquierda. 


e Fisher: Este es más general que el anterior y se define: g, = £3, si su valor es igual a O será simétrica, mayor que cero 


asimétrica a derecha, y si no asimétrica a izquierda. 


La curtosis o aplastamiento hace referencia al grado de apuntamiento de una distribución. 

La distribución normal con v = 1 tiene forma campanoide y simétrica. Si comparamos otras distribuciones con la normal 
N(0,1), para saber si son más o menos puntiagudas podemos encontrarnos con mayor apuntamiento ( leptocúrtica ), menor 
apuntamiento (platicúrtica ) o apuntamiento similar ( mesocúrtica ). 


Leptocúrtica Mesocúrtica Platicúrtica 


si es igual a O es mesocúrtica(nomal- gauss), mayor que cero es leptocúrtica y puntiaguda y menor que cero platicúrtica y 
aplanada. 
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1 Introducción: 


Los fenómenos naturales, o diferentes experimentos objeto del estudio científico, pueden clasificarse en deterministas y 
aleatorios: 


e Son fenómenos deterministas aquellos que pueden predecir se desde sus condiciones iniciales de forma exacta. Pueden, 
en general, modelizarse por estructuras algebraicas como una ecuación o una función. 


e Son fenómenos aleatorios aquellos que tienen un resultado incierto, aunque se realicen bajo las mismas condiciones. 
Por ejemplo, lanzar una moneda. 


Evidentemente, la separación entre ambos tipos no es total y hay una infinidad de fenómenos que, debido a su extremada 
complejidad y aunque sean regulables por leyes físicas, deben tratarse de forma estocástica. El estudio de estos sucesos 
aleatorios, o de aquellos que se tratan como tales, es el objeto de la probabilidad. 

Esta rama de las matemáticas es una de las más ampliamente utilizadas en los más diversos campos y contextos: política, 
economía, medicina, psicología, ... Desde el comportamiento de un electrón, hasta el movimiento de las nubes nos descubren 
sus propiedades a través del prisma de la probabilidad. 

Sin embargo, el estudio riguroso de los conceptos que rigen el azar es relativamente reciente. Hasta el siglo XVII sólo 
hubo algunos acercamientos combinatorios a los procesos azarosos. Fermat, Pascal, Bernoulli, Bayes, Laplace, Legendre o 
Gauss son algunos de los grandes matemáticos que contribuyeron al desarrollo de la probabilidad. Sin embargo, no es hasta 
el siglo XX cuando Kolmogorov desarrolló una definición axiomática satisfactoria. 


2 Frecuencia y probabilidad. Definición de probabilidad 


El término probabilidad es un concepto aparentemente crítico y difícil de precisar. La primera definición, lo que conocemos 
como definición clásica o a priori de probabilidad, aparece ligada a los juegos de azar. Su definición precisa se debe a Laplace 
(principios del siglo XIX). 

Laplace establece que: La probabilidad de un suceso es el cual al cociente del número de casos favorables (hacen que 
ocurra el suceso) y el número total de casos que pueden ocurrir siempre que los casos sean igualmente probables. 

Definición: Si un experimento puede ocurrir de n maneras mutuamente excluyentes e igualmente probables y solo n¿ de 
ellas poseen una propiedad A entonces la propiedad de que ocurra Á es 92. 

Ejemplo: Cuando tiramos un dado de seis caras, es equiprobable que salgan cada una de sus caras, y son excluyentes. 
Si elegimos una propiedad, por ejemplo que sea múltiple de 3, tendremos 2 casos 3 y 6. Por lo tanto la probabilidad será 
= 3 = 0,333 > 33, 33% 

Sin embargo si este dado está trucado, y por lo tanto la probabilidad de que salga cada una de sus caras no es la misma, 
ya no podríamos aplicar la ley de Laplace. 

Observar que por definición la probabilidad de que ocurra A es un número positivo entre cero y uno. Siendo cero cuando 
no haya ninguna manera de obtener el suceso A en el experimento, es decir, Á es un suceso imposible. Y siendo 1 cuando 
cualquier resultado del experimento posee la propiedad A. Diremos, en ese caso, que Á es un suceso seguro. De este modo 
está expresada la probabilidad en tanto por uno, pero también suele expresarse en tanto por 100, 0% de probabilidades para 
el suceso imposible y 100% de probabilidades para el seguro. 


[ES] 


P(A) = Ma <n > P(A) € [0,1] 


Existen varios inconvenientes en esta forma de definir la probabilidad: a)¿Qué ocurre si el número de casos es infinito? 
b) En la definición de probabilidad, usamos la palabra probable. 

Estas cuestiones hacen complicado aplicar la definición fuera del contexto de los juegos de azar. Por ejemplo, ¿cómo 
aplicamos la definición a la probabilidad de que un recién nacido sea varón, o a la probabilidad de que un trébol tenga cuatro 
hojas? Incluso en ejemplos numéricos como la probabilidad de que eligiendo un número natural al azar éste sea par, la 
definición anterior se muestra insuficiente. 

Estos problemas nos llevan a plantearnos la definición frecuentista, empírica o a posteriori de probabilidad. Para esta 
definición debemos suponer que estamos estudiando un experimento aleatorio que puede ser repetido bajo las mismas 
condiciones un número indefinido de veces. 

Por ejemplo, lanzamos 100 veces una moneda sesgada obteniendo 68 caras y 32 cruces. Cabe esperar que la probabilidad 
de obtener cara sea cercana al 68 %. Es decir, al valor de la frecuencia relativa del suceso “Obtener cara”. Más aún, sería 
esperable que si en vez de 100 veces hiciéramos el experimento 10% veces la frecuencia relativa así obtenida fuera todavía 
más exacta y cercana a la probabilidad. Luego podríamos plantear como definición de un suceso A la siguiente: 


Donde f.,(4) y F(A) denotan la frecuencia relativa y absoluta de A respectivamente. 
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Esta definición de probabilidad es muy útil para el estudio de teorías físicas. 

Evidentemente, elegir la *Ley del azar? como definición de probabilidad plantea problemas técnicos obvios, como el de 
la convergencia, o como el de definir qué significa realizar un experimento en las mismas condiciones y llevarlo a cabo un 
número indefinido de veces 

Necesitamos entonces construir un marco teórico-matemático que recoja las consideraciones anteriores y que nos permita 
modelizar los experimentos aleatorios y los cálculos de probabilidades. 

Para ello, consideraremos al espacio de todos los posibles casos que pueden ocurrir en un experimento, como un conjunto 
al que llamaremos espacio muestral (E —> conjunto). 

Llamaremos suceso a cualquier subconjunto S € E y diremos que “ocurre S” si el resultado del experimento es s € S 

Antes de continuar y asignar probabilidades estudiaremos las operaciones más usuales que podemos hacer con los sucesos 
dentro de un espacio muestral. 


3 Operaciones con sucesos 


En este apartado consideraremos E, un conjunto, y trabajaremos con el conjunto partes de E, que denotaremos por gp(E), y 
que se define como el conjunto cuyos elementos son todos los subconjuntos de E. 


p(E) = (AJA C Ej 


Las consideraciones que vamos a hacer son propias de teoría de conjuntos, pero las desarrollaremos aquí para dar una 
visión completa de la teoría de la probabilidad. 

Definición: Las operaciones conjuntistas “unión”, “intersección” y “resta” definen las homónimas operaciones de sucesos 
en un espacio muestral: 


ALJB=(=€ Elre Avze B) 


A(]B=(w€ Elre Anze B) 
A-B=fxE Ele AnzEB) 


Destacamos por su importancia en probabilidad la siguiente operación: 

Definición: Llamaremos suceso complementario, o suceso contrario, de un suceso A, y lo denotaremos por A, al conjunto 
formado por todos los elementos del espacio muestral que no están en A, es decir: 

A=(x€ Elx € A) 

Denotaremos, como es habitual, al conjunto vacio por f. Notar que () es un suceso imposible y que E es un suceso seguro 
(no tienen por qué ser los únicos, por ejemplo, en un espacio muestral continuo se puede ver que los sucesos con un número 
finito de puntos son imposibles). 

Definición: Diremos que dos sucesos son incompatibles si su intersección es vacía. Es decir, A y B incompatibles si 
ANB=0. 


Enumeramos, a continuación, algunas propiedades básicas de las operaciones con sucesos. 
e Cualquier suceso es idempotente respecto a la unión e intersección: A()4= AUJA= A 
e Si AC B, entonces la unión de ambos es el subconjunto “mayor” y la intersección el “menor”: A)B=AyAUB=B 


e Como consecuencia de la anterior se calculan fácilmente las uniones e intersecciones de un suceso con el suceso vacío y 
el espacio muestral: A()0 =0,AUJ0 = 4,4AN)E=A,AUE=E 


e La unión y la intersección son operaciones conmutativas y asociativas. 
e La unión es distributiva respecto a la intersección y viceversa. 
e La diferencia entre el espacio muestral y un suceso es el complementario del suceso: E — A= A 


e Calcular el complementario es una operación involutiva, es decir, el complementario del complementario es el suceso 
inicial: A = A. 


e Leyes de de Morgan (relación entre el complementario y la unión e intersección): 


— Primera ley de Morgan: E 
AUB=ANB 
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Demostración: 
AUB=(xljx ¿(AU B)) 
=(ax É Anc B) 
= [rie Anze B) 
=ANB 


— Segunda ley de Morgan: 


Demostración: 


AnB=(xxgé (AN B)) 
=(alx¿ AVE Bj 
= [xjxe Avxe B) 
=AUB 


— Las Leyes de de Morgan, pueden generalizarse a uniones e intersecciones de familias arbitrarias de conjuntos: 


Va =Na 


¡El ¿El 
Ns=U4 
¡El ¡El 


El siguiente paso, una vez que ya hemos modelizado el espacio muestral, es asignar probabilidades a los sucesos. En 
principio, nos gustaría construir una función: 
P:p(E)>R 


en el que a cada suceso le asignase una probabilidad, pidiendo que cumpla ciertas propiedades que serían deseables: 
e La probabilidad del espacio muestral fuese 1 (P(E)=1) 
e La probabilidad del suceso vacío fuese cero (P(M)=0), 


e que fuese aditiva para sucesos incompatibles AMB =(f > P(AUB)=P(4A)+P(B) 


e que la probabilidad de un suceso y de su complementario sumasen uno (P(4) + P(4) = 1). 


Como veremos más adelante, esta función de probabilidad puede construirse sin problemas cuando el espacio muestral es 
finito o numerable (ya que el conjunto p(E) también lo es). Sin embargo, surgen problemas cuando trabajamos con espacios 
muestrales continuos. Cualquier experimento cuya medida sea un número real resulta en un espacio muestral continuo, por 
ejemplo, el tiempo en un experimento físico. Si estás realizando un experimento físico y estás interesado en el tiempo que 
toma que ocurra un evento específico, el espacio muestral sería el conjunto de todos los valores de tiempo posibles, que es un 
conjunto continuo. 

En estos casos, definir una función con dominio p(E) no es posible. Estamos topándonos con problemas de teoría de la 
medida, existen conjuntos medibles y conjuntos no medibles. Para tratar estos casos debemos quedarnos con subconjuntos 
de gp(E) que contengan una familia deseable de sucesos. Es decir, que contenga los sucesos con los que queremos trabajar y 
sea una familia cerrada para las operaciones elementales con sucesos. Aparecen así los conceptos de álgebra y c-álgebras de 
SUCESOS. 


4 Álgebras y c-álgebras de sucesos 


Definición: Diremos que un subconjunto, A, de g(E) es un álgebra de sucesos si: 
e El espacio muestral es un elemento de A: EE A 
e Si un suceso pertenece a A, entonces también pertenece a A su complementario: SEA=>SEA 


e La unión de dos elementos cualesquiera de A, es un elemento de A: S1,S52 € A=>-51US2€ A 
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Notar que si pedimos que A sea un conjunto no vacío, la primera condición es redundante. Sea S € A entonces S € A y 
por tanto E=SUSEA 

Notar que, aunque solo hemos pedido que Á sea cerrado para complementarios y uniones, de estas condiciones se deduce 
que también es cerrado para intersecciones y diferencias. Si 51,83 € A: 


>= SNS, =S,US € A 


> 51 -S%=S/NS€ A 


Sin embargo, este tipo de conjuntos de sucesos (las álgebras de sucesos) no son plenamente satisfactorios y dejan fuera 
sucesos de los que sería deseable poder calcular su probabilidad. Por ejemplo, cuando lanzamos un dado de 6 caras y anotamos 
el resultado, podemos considerar los sucesos A, =“Sacar un 6 por primera vez en la tirada n-ésima”. Sería deseable que 
nuestro subconjunto de sucesos contuviera al suceso UU, ¿y An = "Sacar un 6 al cabo de un número finito de tiradas” 

Por ello, se suele trabajar con los siguientes conjuntos de sucesos. 


Definición: Diremos que un subconjunto, A, de g(E) es una o-álgebra de sucesos si: 
e El espacio muestral es un elemento de A: EE A 
e Si un suceso pertenece a A, entonces también pertenece a A su complementario: SEA=>SEA 


e La unión de de una familia contable (finita o numerable) de elementos de A, es un elemento de A: 7 contable, (S; hier € 
A=> VierSi EA 


Notar que, como antes, si pedimos que Á sea un conjunto no vacío, la primera condición de la definición es redundante. 
De las demás condiciones de la definición se deduce fácilmente que A es cerrado para la diferencia y para las intersecciones 
de familias contables de sucesos. Notar además que, si el espacio muestral es finito, ambas definiciones coinciden. 

Cuando tenemos un par (E, A), con A una o-álgebra, llamamos a dicho par, espacio medible. Este concepto, propio de la 
teoría de la medida, cuando el espacio muestral es continuo, está íntimamente ligado con los conjuntos de Borel en R”. Que 
podamos asignar una probabilidad a un subconjunto de E será equivalente a poder “medir” dicho subconjunto y la asignación 
de probabilidad estará íntimamente ligada al valor de una cierta medida. 


5 Función de probabilidad 


Con todos estos elementos hemos creado un marco teórico adecuado para definir la función de probabilidad. A la que 
exigiremos, como ya hemos dicho, que sea 1 para el suceso seguro, sea aditiva, y que la suma de las probabilidades de un 
suceso y su contrario sea 1. 

Definición: Sea (E,A) con E espacio muestral y A una o-álgebra de sucesos. Diremos que una aplicación P: A=>R es 
una función de probabilidad si cumple: 


e La probabilidad de cualquier suceso es positiva (eventualmente 0): P(S) > 0,VS € A 
e La probabilidad del espacio muestral es 1: P(E) =1 


e La probabilidad de cualquier familia contable de sucesos incompatibles dos a dos es igual a la suma de las probabilidades 
de los elementos de la familia. 


(5. 2ERE A, 5,05, =0 => P(L) 5.) = Y P(8a) 
n=1 


n=1 


Estos tres axiomas con los que se define una función de probabilidad son consistentes y no superfluos. Junto con la noción 
de d-álgebra, componen la definición axiomática de probabilidad debida a Kolmogorov, quien la introdujo a principios del 
siglo XX, concretamente publicó su trabajo en 1933. 


5.1 Espacio muestral finito 


Si el espacio muestral es finito (o numerable), para definir una función de probabilidad, basta con otorgar probabilidad 
positiva a cada uno de los casos elementales de forma que la suma de todas estas probabilidades sea 1. De esta forma la 
probabilidad de cualquier suceso será la suma de las probabilidades de los casos elementales que lo componen. 

SIE =([21,..,T nj, A = e(E) =X42;,,..., Ti, Hij € (1, ..., nj, definimos P(x,) = k, de forma que )k; = 1. Luego si 
S =XÁ%;,,..., Ti, y € A, se tiene que P(S) = k;, +....+k;,,. P así definido es una función de probabilidad. 
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Si los casos elementales en un espacio muestral finito son equiprobables, entonces, si n es el cardinal de E, necesariamente: 


Además, la probabilidad de cualquier suceso será el cociente entre el cardinal del suceso y el del espacio muestral: 


rc) 9-8 
[El on 

En estos espacios finitos equiprobables recuperamos la definición de probabilidad debida a Laplace. Notar además que, en 
los espacios finitos equiprobables el cálculo de probabilidades está íntimamente ligado a la combinatoria, ya que para dar una 
probabilidad deberemos “solo” contar el cardinal de los conjuntos S y E. 

Un ejemplo de espacio finito equiprobable sería lanzar una moneda (el espacio muestral en este caso tendría dos sucesos 
posibles cara o cruz), con este mismo ejemplo si la moneda está trucada para que caiga cara con mayor probabilidad ya no 
sería equiprobable. 


5.2 Espacio muestral continuo 


Si el espacio muestral es continuo, como hemos dicho antes, no es tan sencillo determinar los conjuntos que deben aparecer 
en A. 

Un ejemplo típico de este tipo de espacios muestrales nos lo dan las variables aleatorias continuas. Por ejemplo, la 
distribución normal tipificada tiene como espacio muestral a E = R y asigna probabilidades a los conjuntos medibles mediante 
la siguiente expresión: 


P(S C B(R)) = a Ja 2 dx (1) 


Donde hemos denotado por B(R) al conjunto formado por los subconjuntos de Borel de R. 


Podemos encontrar otro ejemplo de espacio muestral continuo en las probabilidades geométricas ya que sus espacios 
muestrales están definidos por regiones geométricas en un plano o en el espacio. En este caso la probabilidad de un suceso, 
P(S), se calcula como el cociente del área de S entre el área del espacio muestral E. 


Un ejemplo sencillo sería que teniendo un círculo de radio 2 unidades (E) y un sector circular (S) dentro de ese círculo 
que abarca un ángulo de 60 grados. Queremos calcular la probabilidad de que un punto aleatorio en el círculo caiga dentro 
de este sector. Tenemos por lo tanto que A(E) = 47 unidades cuadradas. Que A(S) = (60/360) - A(E) = (2/3) unidades 
cuadradas. Y por tanto la probabilidad de que caiga en el sector es: 


6 Propiedades de los espacios de probabilidad 


No hemos comprobado todavía que con las condiciones solicitadas en la definición nuestra función de probabilidad cumpla 
todas las propiedades que esperábamos de ella: 


1. La probabilidad del conjunto vacío es 0: P(0) = 0. En efecto: ÓN E = f luego son sucesos incompatibles. Por tanto 
1 =P(E) = P(EU0) = P(E) + P(0) = 1++P(0). Por lo que P(0) =0. 


2. La probabilidad de un suceso y su contrario suman 1: P(A)+P(A) = 1. En efecto, un suceso y su contrario son sucesos 
incompatibles, además la unión de ambos es el espacio muestral por lo tanto: 1= P(E) = P(AU A) = P(4) + P(4) 
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3. Si un suceso está contenido en otro, la probabilidad del primero es menor que la del segundo: AC B > P(4) < P(B). 
En efecto, basta con considerar la siguiente descomposición de B por sucesos incompatibles B = AU(B-— A) y hacer 
uso de que la probabilidad de cualquier suceso es positiva. 


P(B) =P(4) +P(B- A) > P(B- A) = P(B) - P(A4) > P(B) > P(A) 


4. La probabilidad de cualquier suceso es menor que 1: P(A) < 1. Basta con considerar la descomposición de E por 
sucesos incompatibles E = AU A y hacer uso que la probabilidad de cualquier suceso eso positiva. 


5. Relación entre la probabilidad de la probabilidad de dos sucesos, la de su unión y la de su intersección: 
P(AUB) = P(4) + P(B) - P(AN B) 
Para la demostración consideraremos las siguientes descomposiciones por sucesos incompatibles: 


A=(A4- BJU(ANB)=> P(A) = P(A- B)+(AN B) 


B=(B-AJU(ANB) => P(B) =P(B-A)+(4nNB) 
AUB=(A- B)JU(ANB)U(B- A) > P(AUB) = P(A- B)+ P(ANB)+P(B- A) 
Teniendo en cuenta las dos primeras llegamos a: 
P(4)+P(B) = P(A- B)+P(B-A)+2P(AN B) 
P(4)+P(B)- P(ANB) =P(A- B)+P(B- A) + P(ANB) =P(AU B) 


6. La anterior relación puede generalizarse a uniones de un número finito de sucesos A, 42,..., An: 


r(Ua) - ria Y PANA) + + DA Y PA M..DA;) +. +(1) P(A1N...MAn) 


1<i<j<n 11<..<ip El 


Donde: 


P(U;_, 4) es la probabilidad de que al menos uno de los sucesos A; ocurra. P(4;) es la probabilidad de que ocurra 
el suceso A;. P(A,N Ay) es la probabilidad de que ocurran simultáneamente los sucesos A; y Aj. P(A4;,, N...NA;,) es 
la probabilidad de que ocurran simultáneamente los sucesos A , Ai, y así sucesivamente. K se va aumentado una 
unidad hasta llegar a n. 


Ho. 


7 La ley de los grandes números. Relación entre frecuencia y probabilidad 


Ya hemos demostrado anteriormente desde la definición axiomática de Kolmogorov la ley de Laplace. Sin embargo, no hemos 
obtenido la forma de justificar la ley de los grandes números, es decir, la definición frecuentista, experimental o a posteriori 
de probabilidad que hemos mencionado en la segunda sección. 


P(S)= lim £.(S) = lim Fn(8) 
n>00 n>00 n 

Para hacer una demostración formal deberíamos avanzar en la teoría de la probabilidad y de las variables aleatorias para 
poder definir el concepto de convergencia en probabilidad o convergencia casi segura. Dichos conceptos quedan fuera del 
alcance de este tema por lo que haremos una demostración informal explicando el esquema de una posible prueba. 

Consideremos un espacio muestral, E, y un suceso, S, de dicho espacio, entonces podemos considerar la siguiente variable 
aleatoria: ”X = número de veces que ocurre $ en n repeticiones del experimento” 

Esta variable se distribuye según una binomial de n intentos y cuya probabilidad de éxito, p, es la probabilidad de que 
ocurra S en un intento, p = P(S) : X = Bin(n,p). Es un hecho conocido, que si n es suficientemente grande entonces la 
distribución de esta variable discreta se distribuye según una distribución normal de media np y desviación típica /np(1 — p). 
X = N(np, y/np(1 — p)). 

Por tanto, hn(S) (frecuencia relativa del suceso), se distribuye de la siguiente manera: 

e 
n 


18) = ho Nip, ) 


Cuando n tiende a infinito observamos que la desviación típica de la frecuencia relativa tiende a 0, es decir, h,,(S), tiende 
a una distribución unipuntual centrada en su media, p. Dicho hecho justifica teóricamente que las frecuencias relativas de un 
suceso tiendan a la probabilidad de dicho suceso cuando el experimento se repite indefinidamente. 
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8 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Dentro de los saberes básicos es el sentido estocástico 
donde se da uso práctico a lo presentado en este tema y que se desarrolla a lo largo de todas las etapas con distintos niveles 
de profundidad. Es uno de los temas más interesantes para trabajar la CEM 6 ya que sus aplicaciones prácticas y cotidianas 
son muy directas y visibles a la hora de poder motivar al alumnado y trabajar obteniendo datos reales de su entorno. 
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1 Introducción: 


La probabilidad es, seguramente, una de las ramas matemáticas más ampliamente utilizadas en diversos campos y contextos: 
política, economía, medicina, psicología... Desde el comportamiento de un electrón, hasta el movimiento de las nubes nos 
descubren su propiedades a través del prisma de la probabilidad. 

Sin embargo, el estudio riguroso de los conceptos que rigen el azar es relativamente reciente. Hasta el siglo XVII sólo 
hubo algunos acercamientos combinatorios a los procesos azarosos. Fermat, Pascal, Bernoulli, Bayes, Laplace, Legendre o 
Gauss son algunos de los grandes matemáticos que contribuyeron al desarrollo de la probabilidad. Sin embargo no es hasta 
el siglo XX cuando Kolmogorov desarrolló una definición axiomática satisfactoria de probabilidad. 

En este tema nos centraremos en el concepto de probabilidad condicionada. Este concepto permite decidir cuantitativamente 
qué sucesos interfieren entre sí sobre sus probabilidades. Llegaremos con este estudio a desarrollar los teoremas de probabilidad 
total y de Bayes de gran utilidad en la modelización y cálculo de probabilidades en experiencias compuestas. Así mismo, 
definiremos el concepto de sucesos independientes (o aquellos que no interfieren entre sí en sus probabilidades). 


2 Definición axiomática de probabilidad. 


Ya hemos comentado que el estudio matemático de la probabilidad es relativamente reciente. Debemos a Kolmogorov (1933) 
el desarrollo de la base axiomática utilizando la teoría de la medida. Aunque no es el concepto central de este tema, haremos 
una presentación breve de la definición axiomática de probabilidad y sus propiedades básicas para poder introducir los 
conceptos que necesitaremos y fijar al mismo tiempo notaciones. 

Consideraremos E un conjunto, al que llamaremos espacio muestral. 

Definición: Diremos que un subconjunto, A, de p(E) es una o0-álgebra de sucesos si: 


e El espacio muestral es un elemento de A: E€ A 
e Si un suceso perteneces a A, entonces también pertenece a A su complementario: S€ A=>8S€ A. 


e La union de una familia contable (finita o numerable) de elemento de A, es un elemento de A: T contable, (S;hier 
A=> UicrS; EA 


De la anterior definición se puede deducir que A es cerrado no solo para uniones y el complementario, si no también para 
intersecciones y diferencias de sucesos. 

Definición: Diremos que dos sucesos son incompatibles si su intersección es vacía. Es decir, A y B incompatibles si 
ANB=0 

Definición: Sea (E, A) con E espacio muestral y A una o-álgebra, de sucesos. Diremos que una aplicación P: A>R es 
una función de probabilidad si cumple: 


e (i) La probabilidad de cualquier suceso es positiva (eventualmente 0): P(S) > 0,VS € A 
e (ii) La probabilidad del espacio muestral es 1: P(E) = 1 


e (iii) La probabilidad de cualquier familia contable de sucesos incompatibles dos a dos es igual a la suma de los elementos 
de la familia. 


(5) 521 € AIS¡N 8, =0 => P (0 5,) = Y P(8) 
n=1 


n=1 
Algunas consecuencias de la definición son: 

e La probabilidad del conjunto vacío es 0: P(0) =0 

e La probabilidad de un suceso y su contrario suman 1: P(S) + P(S) = 1 

e Si un suceso esta contenido en otro, la probabilidad del primero es menor que la del segundo Si € Sa > P(S1) < P(S2) 
e La probabilidad de cualquier suceso es menor que 1: P(S) < 1 


e Relación entre la probabilidad de dos sucesos, la de su unión y la de su intersección: 


P(S1 U Sa) = P(S1) + P(S2) = P(S1 NM Sa) 


e La anterior relación puede generalizarse a uniones de un número finito de sucesos: 


»(Us)-Er- So PS0S)+. .+ED. Y P(S,N..0S;)+.. (1) P(8,0...NS) 


1<i<j<n 14 <..<ip El 
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3 Probabilidad condicionada 


La probabilidad condicionada modeliza matemáticamente el hecho de que la probabilidad de que ocurra un suceso varía si 
tenemos información adicional sobre el resultado. Por ejemplo, la probabilidad de que llueva un día en una ciudad es distinta 
si conocemos a qué estación del año pertenece ese día. O, por ejemplo, cabe esperar que si sabemos que una persona es joven 
la probabilidad de que padezca cierta enfermedad sea menos de la que padezca una persona de la que desconocemos la edad. 

Veámos otro ejemplo e intentaremos, desde un punto de vista frecuentista, cuantificar estos hechos: Supongamos una 
fabrica que producen 10000 móviles al mes de dos marcas diferentes Pear y Sam (8000 y 2000 móviles respectivamente). Se 
detecta que de los móviles producidos cada mes 2000 tienen problemas con la batería, de los cuales 100 son de la marca Sam. 
Entonces: 


e Porcentaje de móviles de Sam: 2000/10000 = 20% = A 
e Porcentaje de móviles que son de marca Sam y tienen problemas de batería: 100/10000= 1% = B 
e Porcentaje de móviles marca Sam con problemas en la batería: 100/2000= 5% =C 


Esta última frecuencia corresponde a la idea de probabilidad condicionada. Notar además que se cumple la relación 
C = B/A.0.01/0.2 = 0.05. Es decir que el porcentaje de móviles con problemas de batería si buscamos solo entre la marca 
Sam se calcula dividiendo el porcentaje de móviles de marca Sam y que tienen problemas para el porcentaje total de móviles 
de Sam. 

Otro ejemplo: lanzamos un dado y anotamos su puntuación. Los casos son equiprobables y podemos calcular la 
probabilidad mediante la regla de Laplace: 


e P(par)=3/6 
e P(par y > 2)= 2/6 
e P(> 2 si sabemos que es par)= 2/3 


Esta última corresponde a la probabilidad condicionada. Notar que: P(> 2 si sabemos que es par)= P(par y > 2)/P(par). 
A partir de los ejemplo anteriores podemos obtener las siguiente definición: 
Sea (E, A, P) un espacio de probabilidad y S € A un suceso no imposible tal que P(S) > 0. Llamaremos probabilidad de 
B € A condicionada a S y lo denotaremos por P(B|S) al siguiente cociente: 


P(BNS) 
PBIS) = 5 
as - 
P(B|S) es la probabilidad de que el evento B ocurra dado que S ya ha ocurrido. Notar que P(-|S) es una función de 
probabilidad para (E,A). En efecto: P(-|S) : A —>R ya que cumple: 


e (i) se cumple ya que P es una función de probabilidad 


— P(ENS) 


(S)_ 
P(5) = 


Ya 
7 H6) 


e (iii) Se cumple por ser la intersección distributiva respecto a la unión: 


e (ii) se cumple ya que P(E|5S) 


E, Ba, PUED, 3 P(Ba Z 
P(U2,B,15)1B,08, =0 > Pu2,8,]5) = PRE 2005 - POS) - ra POS) pas) 
n=1 


P(S) P(S) P(S) 
Luego P(-|5) cumple las 6 propiedades que hemos enunciado en la sección anterior. Destacamos algunas otras propiedades 
que cumplen las probabilidades condicionadas: 
e P(SIE) =P(S),VS € A 
e P(SIS)=1, 15€ A,P(S) >0 
e P(SNB)=P(B)P(S|B) = P(S)P(B|S),VS,B € A, P(S),P(B)>0 


4 Experiencias compuestas 


Veamos cómo aparece la probabilidad condicionada en la representación de experiencias compuestas. Entendemos por 
experiencias compuestas aquellas que pueden ser descritas como una secuencia de experiencias más simples. En la pfactica 
nos aparecen este tipo de experiencias cuando los experimentos constan de una serie (temporal) de pasos (o pueden describirse 
de esta forma) o cuando de una serie de individuos estudiamos diferentes características. 
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4.1 Arboles (grafos) para describir experiencias compuestas que se pueden secuenciar 


En una caja con 20 bolas, 8 son rojas y 12 verdes. Elegimos dos al azar. Nos interesa conocer las probabilidades de 
las diferentes combinaciones de colores que podemos obtener. Esta experiencia aleatoria es equivalente a la experiencia 
secuenciada: 


1. Elijo una bola al azar y miro su color 
2. Elijo una bola al azar de entre las que quedan después de la primera extracción y miro su color. 


Los resultados de color obtenidos en el experimento los podemos presentar mediante un diagrama de árbol de la siguiente 
manera. Llamamos V al resultado de elegir una bola verde y R al de elegir una roja. 

En el primer paso las probabilidades en cada caso, teniendo en cuenta la regla de Laplace, son P(V)= 12/20 y P(R)=8/20. 

En el segundo paso si nos colocamos al final de la rama V del primer paso la probabilidad de obtener verde está condicionada 
a que sabemos que en la primera hemos obtenido verde, luego quedan 19 bolas, 11 verdes y 8 rojas. P(V|1*V) = 11/19. De 
la misma manera obtenemos P(R|1*V) =8/19,P(V|1*R) = 12/19 y P(R|19R) =7/19. 

Dichas probabilidades suelen representarse en las ramas del árbol como se ha hecho en la figura: 


PB NA 
t =, 
tl 
y ea PO: AA) 


Yo ss SL 
| ou RA R PyR 2.3 
s | = 19 Va P( RIN) E La 
HR. R A de 
Zo Ú 
; AE 
( a R PUR, R) 2 
| 


En la imagen tenemos también cómo calcular la probabilidad de que las dos bolas sean verdes, es decir P(1*V A 2%V), 
aplicando la definición de probabilidad condicionada. 

Gráficamente lo que tenemos que hacer para obtener esta probabilidad es multiplicar las probabilidades de todas las ramas 
del camino que nos llevan a la elección de dos bolas verdes. 

También podemos calcular la probabilidad de que solo una bola sea verde. Para ello deberemos calcular la probabilidad 
de dos sucesos más simples: o bien de que la primera sea verde (y la segunda no) o vicecersa. Siendo estos dos sucesos 
disjuntos. Para ello: 


28.8 0 
P(AVN2RU(ERN2V)) = PACVN2R)4P(RN2V) = PV) P2URIIUV)4+P(1UR)PUV|LR) => 515420 '10 


4.2 Tablas de contingencia 


Las tablas de contingencia nos permiten describir experiencias compuestas en las que estudiamos dos propiedades de los 
individuos. 

Partiendo el mismo caso del ejemplo anterior (20 bola, 12 verdes y 8 rojas) sabemos que 5 bolas verdes y 2 rojas son de 
tamaño pequeño, el resto grandes. Podemos clasificar las bolas según una tabla de dobre entrada (una matriz) como la de la 
figura. En cada casilla está representado el número de individuos que poseen las características que marca la columna y la fila 
de las dos propiedades que estamos mirando, color y tamaño. Representamos por V y R el color verde y rojo respectivamente 
y por P y G, el tamaño pequeño y grande. Así si extraemos una bola al azar podemos calcular las múltiples probabilidades 
directamente de los datos de la tabla. 


Tamaño-Color | V | R | Totales | 
G 716 13 | 

P 5 |2 To | 
Totales 12|8 20 | 


Por ejemplo, la probabilidad de que sea grande será P(G) = 13/20, la probabilidad de que sea pequeña y verde será P(PNV) = 
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5/20, la probabilidad de que sea pequeña o verde será P(PUV) = P(P) + P(V) - P(PNV) =7/20+12/20— 5/20 = 14/20 

o la probabilidad que sea grande sabiendo que es roja es 

P(GNR) 
P(R) 


6/20 6 
8/20 8 


P(G|R) = 


4.3 Particiones del espacio muestral 


En general los anteriores son casos particulares y situaciones en las que tenemos dos particiones del espacio muestral por 
familias (S,)f_, y [B,) (familias de sucesos incompatibles 2 a 2 cuya unión es todo el espacio muestral). 

En el primer caso hemos modelizado una situación en la que el experimento se secuencia ocurriendo un suceso 5; y una 
vez que sabemos que ha ocurrido dicho suceso ocurre un suceso B,. Las probabilidades naturales de calcular estos casos son 
P(S;) y P(B,|S,) que se colocan sobre las ramas del árbol. El productor de las probabilidades de las ramas de un camino 

En este caso se puede generalizar a experimentos compuestos que se componen de una secuencia de un número de casos 
cualquiera. Para ello basta probar que: 


P($,0...0S,) =P(81)- P(SaS)-P(S]S HS) >. Mri8s, n. Js. E) 


Esta demostración se puede hacer por inducción sobre n. Así en el caso de n pasos se puede dibujar un árbol con 
n momentos de ramificación en el que en las ramas escribamos las probabilidades condicionadas a los sucesos realizadas 
anteriormente y el producto de todas las ramas en virtud del resultado anterior nos proporcionará la probabilidad de la 
intersección de todos los sucesos ocurridos para llegar a un camino determinado. 

En el segundo caso la primera familia modeliza la primera propiedad que se estudia de los individuos y cada suceso 
modeliza un valor para esa propiedad, lo mismo para la segunda familia. En este tipo de ejemplos se suele hablar del número 
total de individuos que cumplen ciertas propiedades por lo que se genera una matriz en la que colocamos los valores de la 
primera familia en las columnas y los de la segunda en las filas (o al revés) y en la casilla (i, j) el número de individuos que 
cumplen S;, B;: N(i,j). Si realizamos totales por columnas obtenemos el total de individuos que cumplen 5: T'S(i). Y 
del mismo modo los totales de filas de B;: T'B(j). Por último, al agregar todos los totales obtenemos el total de individuos 
estudiados 7”. e 

Así P(S;) = TS(i)/T, P(B;) = TB(5)/T, P(S¿N By) = YG2, P(S;|B;) = Ni, )/TB, y P(Bj15;) = N(i,5)/TS,. 


B-S Si Si Sn Totales 

Bi N(1,1) N(i,1) N(n,1) TBUE Y ENE 

Bj N(1,5) N(i,5) N(n, j) TBj =) ¡1 N(5, 5) 

Bm N(1,m) N(i,m) N(n,m) TBm = A N(i,m) 
Totales | TS = 7, N(L,j) TS = BEN TS => 1 NM) | T= 117% = M1 TB; 


5 Teoremas de probabilidad total y de Bayes 


Partimos de un experimento compuesto secuenciado como hemos visto en el apartado anterior (por ejemplo en 2 pasos) 
en el que: (9;)7_, son los resultados posibles del primer experimento y (Bj), son los resultados posibles del segundo 
experimento. Hemos visto cómo calcular P(S, M Bj) y hemos visto como aparecen de forma natural P(S,) y P(B;5|S;). 
Pero no hemos visto cómo calcular P(B,) o P(S;|B;). Los teoremas de probabilidad total y de Bayes dan respuesta a estos 
problemas: 

Lema: Sea (E, A, P) un espacio de probabilidad, y (S,)”_, partición de E tal que P(S,) > 0,Ví. Entonces P(B) = 
No P(BNS;), VB EA. 

Teorema de la probabilidad total: Sea (E, A, P) un espacio de probabilidad, (S;+?_, partición de E y B € A entonces: 


P(B) =>) P(S)P(BIS;) 


En el ejemplo anterior de las bolas de colores, la probabilidad de que la segunda bola sea verde P(2%V) = P(1*V) - 
P(22V]1%V) + PGR) -POPVILR)=H-B+3:E 

Gráficamente, cuanto tenemos una representación en árbol lo que nos dice el teorema de probabilidad total es que para 
calcular la probabilidad de un suceso de la segunda fase tengo que sumar las probabilidades de todos los caminos que me 
llevan a ese suceso de la segunda fase. Este teorema puede generalizarse a n fases. 

Veamos cómo resolver el 22 problema, es decir, el cálculo de una probabilidad condicionada de un suceso de la primera 
fase a uno de la segunda. 
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Teorema de Bayes: (E,A,P) (5,)%_, partición de E, B € A y P(S;) > 0 entonces: 


P(BIS;) - P(S;) 


515) == 5 
Atendiendo a lo anterior: , PS, B) 
(S,|B) = PB) 
Por ejemplo la probabilidad de que sea roja en la primera si sabemos que ha sido roja en la segunda: 
Et 20:15 7 
Ai e cs aer 


6 Sucesos independientes 


En ocasiones una información extra no provoca cambios en las probabilidades. Por ejemplo, si del lanzamiento de un dado 
sabemos que el resultado es par no podemos inferir nada sobre la probabilidad de que sea menor que 3, ya que con o sin esta 
información la probabilidad es 1/3. La probabilidad de que sea menor que 3 es 1/3 (resultados 1 y 2 de 6 posibilidades) y 
la probabilidad de que siendo par (2,4 o 6) sea menor de 3 (solo el una posibilidad de 3) también es 1/3. Notar que en este 
caso además la probabilidad de que ocurran ambas cosas, que sea par y menor que tres, es solo un caso (2), por lo tanto la 
probabilidad es 1/6. Que coincide con el producto de la probabilidad de que sea par (1/2) y de que sea menor que 3 (1/3). 

En general, dados dos sucesos con probabilidades no nulas, S y B, diremos que son independientes si P(S|B) = P(S). 
Notar que si S y B independientes son equivalentes entonces: 


P(SIB) =P(S) S P(BIS =P(B) SP(SNB)=P(S)-P(B) 

En lo anterior hemos aplicado P(X|Y) = >: Si no queremos exigir que P(S), P(B) > 0 podemos tomar como 
definición de independencia P(SN B) = P(S)P(B) 

Como ejemplo tomemos el lanzamiento de dos monedas. Cada moneda tiene dos posibles resultados: cara (C) o cruz (X). 

Primero, definimos dos experimentos secuenciados el primero será el lanzamiento de la primera moneda y el segundo el 
lanzamiento de la segunda moneda. 

Siguiendo el esquema de experimentos secuenciados suponemos que queremos calcular la probabilidad de obtener cara” 
en el primer lanzamiento (Experimento 1) y ”cara” en el segundo lanzamiento (Experimento 2). La probabilidad de obtener 
”cara” en el primer lanzamiento es P(1%Cara) = 1/2. El resultado de lanzar la segunda moneda no se ve afectado por la 
primera, esto es en si mismo la definición de sucesos independientes. Por lo tanto, la probabilidad de que la segunda sea cara 
también es 1/2 (P(2%C|1%C) = 1/2. Así tenemos que P(CNC) = P(1%C) -P(22C]1*C) = P(1*C)-P(29*C) =1/2-1/2=1/4. 

Algunas implicaciones inmediatas: 


e / y S son independientes para todo S. E y S son independientes para todo $. 


e S y B independientes > S y B independientes. Demostración: P(S MN B)UP(S NB) = P(S) > P(S NB) = 
P(S) - P(SN B) >P(SNB) = P(S) - P(S)- P(B) > P(Sn B) = P(S)[1 — P(B)] > P(SNn B) = P(S) - P(B) 


e S y Bindependientes => S y B independientes. Se puede demostrar aplicando dos veces lo de la demostración anterior. 


Hay que tener en cuenta que la independencia 2 a 2 no implica que una familia de sucesos sea independiente. Por 
ejemplo, en el lanzamiento de dos dados, los sucesos que se especifican a continuación son independientes dos a dos, pero no 
mutuamente independientes: 


e X: Salir impar en el primer dado. P(X)= 1/2 
e Y: Salir impar en el segundo dado. P(Y)= 1/2 
e Z: La suma de los resultados es impar P(Z)=1/2 


Si calculamos las probabilidades de las intersecciones por Laplace nos confirman que son sucesos independientes dos a dos 
PXNY)=P(XN2Z)=P(Y N Z) = 1/4. Sin embargo los tres sucesos son mutuamente excluyentes P(XN YN Z)=0, y 
por tanto, P(XNYNZ)4 P(OPMN)P(Z). 

Así X, Y, Z son independientes si P(XNYNZ)= P(X)P(Y)P(Z) y son independientes dos a dos. Esta definición puede 
generalizarse de forma recursiva a familias finitas cualesquiera y familias numerables. 
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1 Introducción: 


La Estadística tiene actualmente el carácter de ciencia básica, fundamentalmente por dos motivos. El primero de ellos es que 
resuelve problemas de carácter básico y elemental. El segundo, es la cantidad de veces que surgen sus conceptos en la vida 
diaria. A través de los medios de comunicación de masas, como son la prensa, radio, televisión e internet recibimos noticias 
y mensajes que nos obligan a tener una idea clara de los conceptos estadísticos. Ejemplos pueden ser la vida media de la 
población, el aumento del IPC, desviación sufrida en un partido por un jugador de baloncesto con respecto a sus porcentajes, 
etc. 

Algunos ejemplos del uso frecuente que nos encontramos de la Estadística en la vida real pueden ser: 


e ” Juan es más alto de lo habitual”. Aquí estamos haciendo uso del concepto de promedio o media de ciertos elementos. 


e ”Los padres rubios suelen tener hijos rubios”. En este caso, las ideas de semejanzas y diferencias utilizan el concepto 
de correlación. 


e ”Han tomado muestras de sangre de varios ciclistas elegidos al azar”. Aquí usamos el concepto de muestra, al no poder 
abarcar todo el espacio muestral. 


Además de estas apariciones de la Estadística en la vida diaria, nos encontramos que tiene cada vez más aplicaciones, y 
más importantes, en sectores tan dispares como la agricultura, la industria, la administración, etc. 

Pero además, desde hace ya más de un siglo, han comenzado a utilizarse los métodos estadísticos como una técnica 
poderosa en la investigación científica experimental. Y desde la segunda guerra mundial, apareció la Investigación Operativa 
aplicada a la industria, a la estrategia militar e incluso a la resolución de problemas de gobierno. 

Todo lo anterior implica que hoy en día sea necesario conocer las ideas estadísticas mas sencillas, pasando a formar parte 
del bagaje cultural de la humanidad, al mismo tiempo que el método estadístico ha de ser un instrumento de trabajo esencial 
en la ingeniería, economía, sociología y sobre todo, en la investigación experimental (biología, química, médicina, etc.). 


2 Evolución histórica de la estadística y el cálculo de probabilidades 


El nacimiento de la estadística se encuentra arraigado en las civilizaciones antiguas, que, a través de censos poblacionales 
y meticulosos registros, sentaron las bases para la eficiente administración de recursos y la planificación económica. A 
continuación, exploraremos cómo Mesopotamia, Egipto, China, Grecia y Roma contribuyeron al desarrollo de la estadística 
en la antigitedad: 


e Mesopotamia(4000 a.C. - 3100 a.C.): En las fértiles tierras entre los ríos Tigris y Éufrates, la civilización mesopotámica 
floreció. Los escribas mesopotámicos utilizaron tablillas de arcilla para registrar datos cruciales sobre cosechas, población 
y transacciones comerciales. Estos primeros censos poblacionales y registros numéricos proporcionaron información 
esencial sentando las bases para la distribución justa de recursos y la toma de decisiones administrativas. 


e Egipto (3100 a.C. - 30 a.C.): A lo largo de las orillas del Nilo, la civilización egipcia demostró una habilidad excepcional 
para la planificación y gestión de recursos. Los egipcios llevaron a cabo censos detallados para evaluar la población 
y los recursos disponibles. Además, utilizaron registros para calcular los impuestos agrícolas y planificar proyectos 
de construcción a gran escala, como las pirámides. Hay que recordar que el Nilo se desbordaba anualmente, y estos 
registros eran imprescindibles para repartir las tierras correspondientes a sus propietarios tras la crecida. Los egipcios 
conviertieron la problemática de las inundaciones en una oportundidad, desarrollando para ello también el estudio de 
la geometría. 


e China (206 a.C. - 220 d.C.): Durante la Dinastía Han, China experimentó avances significativos en la recopilación y 
análisis de datos. Los censos imperiales chinos documentaron no solo la población, sino también detalles socioeconómicos, 
como la ocupación y la propiedad de la tierra. Estos registros permitieron al gobierno central tomar decisiones 
informadas sobre políticas y asignación de recursos. 


e Grecia (siglos VI a.C. - IT a.C.): En la antigua Grecia, figuras como Heródoto y Jenofonte utilizaron métodos estadísticos 
primitivos para recopilar datos sobre población y recursos. Aunque no desarrollaron un sistema formal de estadísticas 
sentaron las bases para el pensamiento estadístico al reconocer la importancia de los datos empíricos en la toma de 
decisiones. 


e Roma (753 a.C. - 476 d.C.): En el vasto Imperio Romano, los censos eran una herramienta crucial para la administración 
y el control. Se llevaban a cabo censos regulares para evaluar la población, la propiedad y los recursos. Estos censos no 
solo eran instrumentos administrativos, sino también herramientas de ingeniería social que influyeron en la distribución 
de privilegios y responsabilidades. 
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En el siglo XVI, el matemático Italiano G. Cardano obtiene una serie de resultados que escribe en su libro “Libro de los 
juegos de Azar”, hallado con posterioridad a su muerte y publicado casi un siglo después en la ciudad francesa de Lyon. Los 
resultados los consigue como consecuencia del estudio de la combinatoria que él mismo desarrolla junto con su compatriota 
Tartaglia. También plantea en sus escritos problemas sobre juegos con dos y tres dados. 

En el libro anteriormente mencionado, Cardano expone conceptos como la equiprobabilidad, la esperanza matemática, 
elabora tablas de frecuencia para el juego de dados e incluso esboza lo que, 150 años después, sería la Ley de los Grandes 
Números. 

Por esa misma época, un jugador italiano se puso en contacto con Galileo Galilei para mostrarle su sorpresa al comprobar 
que “al jugar con tres dados a la suma 10, tenía más oportunidades de ganar que cuando jugaba a la suma 9”. Galileo 
dio la solución al problema planteado pero sus trabajos fueron publicados ya el inicio del siglo XVII omitiéndose el capítulo 
dedicado al juego de dados. No fue hasta S.XVIII cuando se dio a conocer la obra casi completa de Galileo. 

En la sociedad francesa de 1650, el juego era un entretenimiento corriente. Debido a que cada vez se introducían más 
variantes y las cantidades apostadas subían desmesuradamente, se sintió la necesidad de encontrar un método racional 
para poder ganar. Apareció un noble conocido con el nombre de Caballero de Mére, quien propuso al matemático francés 
Blaise Pascal diversos problemas relacionados con estos juegos. En ellos le pedía explicaciones sobre algunas contradicciones 
aparentes entre su razonamiento teórico y las observaciones que había recogido experimentalmente a través del juego. Alguno 
de los problemas que el Caballero le propuso a Pascal son: 


e Dos personas participan en un juego de azar, ganando la apuesta la primera que logre acumular un cierto número de 
puntos. Si los jugadores se ven forzados a suspender el juego antes de que éste haya terminado, conocido el número de 
puntos que ha acumulado cada uno de ellos, ¿Cómo deberá dividirse la apuesta? 


e En 24 tiradas con dos dados, gana el que obtenga al menos un seis doble ¿Qué es más fácil, ganar o perder? 
e ¿Por qué en el juego de tirar tres dados es más frecuente obtener la suma 11 que la suma 12? 


Estos problemas permitieron establecer a Pascal correspondencia con otros matemáticos, como Pierre de Fermat. Esta 
correspondencia se considera el origen de la Teoría de la Probabilidad. Ambos matemáticos resolvieron los problemas 
propuestos de forma separada. Pascal utilizó su triángulo aritmético haciendo hipótesis sobre las apuestas de cada uno, en 
cambio Fermat se apoyó en el naciente cálculo combinatorio. 

Esta teoría, fundamental para la estadística, se desarrolló más tarde con los trabajos de Christian Huygens y John Graunt. 
A finales del S.XVII, el físico, geómetra y astrónomo holandés C. Huygens también se interesó por la correspondencia que 
existió entre Pascal y Fermat. Publicó, en su idioma natal, una memoria titulada “De Ratiociniis in Ludo Alae”, que 
es considerada hoy en día el primer trabajo impreso dedicado en exclusividad a la probabilidad. En el trabajo aparecen 
muchas de las resoluciones realizadas tanto por Pascal como por Fermat, junto con otros problemas interesantes acerca 
de las probabilidades en los juegos de azar. Por otro lado John Graunt aportó con su publicación pionera, "Natural and 
Political Observations Made upon the Bills of Mortality” (Observaciones Naturales y Políticas Hechas sobre los Registros 
de Mortalidad). Graunt analizó datos demográficos en Londres, sentando las bases para la epidemiología y la inferencia 
estadística. 

Esta forma de ver las cosas llevó a aceptar la definición clásica de probabilidad: “La probabilidad de que se presente 
determinado suceso es igual al número de casos que son favorables a este suceso dividido por el número total de casos posibles, 
con tal de que estos casos sean mutuamente simétricos”. 

En el siglo XVIII, la teoría de la probabilidad experimentó un rápido desarrollo, impulsado por las obras de Bernouilli 
y De Moivre. Jakob Bernouilli, destacó en el estudio del cálculo de probabilidades y escribió el tratado ” Ars Conjectandi”, 
considerado el primer tratado importante sobre la Teoría de Probabilidades. Este tratado consta de cuatro partes, abordando 
desde trabajos previos de Huygens hasta la Ley de los Grandes Números. 

Por otro lado, De Moivre enunció la regla de multiplicación de la teoría de probabilidades y proporcionó las primeras 
indicaciones sobre la distribución normal de probabilidades en sus obras. Durante su exilio en Londres, introdujo la curva 
de distribución de los errores, que posteriormente se conocería como Distribución Normal de Gauss. De Moivre estaba 
particularmente interesado en desarrollar toda la Teoría de Probabilidades con métodos generales, considerándola como una 
nueva Álgebra. 

A medida que la teoría de la probabilidad avanzaba, se observó que sus aplicaciones trascendían los juegos de azar, 
extendiéndose a problemas de campos diversos como estadísticas sobre poblaciones humanas y teoría de seguros de vida. 

Ya en el siglo XIX, Laplace, en su obra ” Theorie Analytique des Probabilites”, amplió la definición clásica de probabilidad 
para abordar estos nuevos problemas. Sin embargo, su enfoque no fue crítico con la definición clásica, lo que llevó a un 
desarrollo significativo en las aplicaciones, pero un estancamiento teórico. 

Durante este periodo, Gauss y Laplace utilizaron de manera independiente las aplicaciones al análisis numérico de errores 
de medida, creando una teoría de errores sistemática. Laplace introdujo el concepto de la regla de sucesión, sentando las 
bases para la inferencia estadística bayesiana. Por otro lado, Gauss, con su distribución normal y el método de mínimos 
cuadrados, proporcionó herramientas fundamentales para el análisis de datos. 

Llama la antención que no fue hasta este siglo cuando Achenwall, en Alemania, introdujo por primera vez la palabra 
Estadística. Este matemático fue considerado el padre de la Estadística por los alemanes. 
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Karl Pearson realizó aportaciones muy importantes a la Estadística, como fue la distribución x? o el test que lleva su 
nombre, para el estudio de la bondad del ajuste de una distribución empírica a otra teórica. Además, el trabajo de Karl 
Pearson y otros pioneros consolidó la estadística como herramienta esencial en la investigación científica. A ambos se les 
pueden considerar los padres de la Estadística moderna. Ya que estos avances permitieron la evolución de la Estadística 
deductiva, estudiada hasta su época, a la Estadística inductiva, que es la que hoy en día tiene una mayor influencia en todas 
las ramas del saber. 

En este siglo se consolidó la estadística como disciplina científica con la obra de Francis Galton. Galton aplicó métodos 
estadísticos al estudio de la herencia y la variabilidad en la población, asentando así las bases para la estadística biológica. 
A Galton también se le debe el descubrimiento de La teoría de la Correlación y la Regresión. Sus trabajos más importantes 
estuvieron relacionados con sus dos grandes aficiones, el estudio de la herencia y la expresión matemática de los fenómenos 
vinculados a ella. En el libro “Hereditary Genius” obtuvo el concepto de correlación a través del estudio de los problemas 
de la herencia,. Fue el primero en asignar a un conjunto de variables un número que permitía obtener una medida del grado 
de relación existente entre ellas. Llegó a inferir que las personas muy altas solían tener hijos más bajos que ellas, y también 
sucedía al revés, las personas muy bajas solían tener hijos más altos que sus progenitores. Esta observación permitió a 
Galton enunciar su Principio de Regresión a la Mediocridad. Este resultó ser el origen del actual análisis de la regresión. 
La observación que realizó Galton es cierta, pero su principio resultó ser inexacto. La justificación radica en que los valores 
extremos en una distribución no se transmiten necesariamente a la descendencia de manera directa, ya que diversos factores, 
incluida la variabilidad genética y ambiental, influyen en los resultados. En resumen, aunque la observación de Galton 
sobre la correlación es válida, su principio de regresión no se sostiene debido a la complejidad inherente a la transmisión de 
características extremas. 

En este siglo también debemos destacar las aportaciones de la matemática y enfermera Florence Nightingale que también 
dejó su huella en este campo. Durante la Guerra de Crimea, Nightingale utilizó gráficos circulares para visualizar la relación 
entre las condiciones sanitarias y las tasas de mortalidad en los hospitales. Esta innovadora representación visual de datos 
allanó el camino para la estadística moderna y la visualización de datos. 

Hubo que esperar hasta el siglo XX para que Kolmogorov desarrollara una definición axiomática satisfactoria de probabilidad. 

Además con la llegada de los ordenadores, la estadística experimentó una revolución sin precedentes, catapultándola 
hacia nuevas alturas de aplicación y sofisticación. Este cambio radical fue impulsado en gran medida por nombres destacados 
en el mundo de la informática y la estadística, cuyas contribuciones marcaron un hito en la forma en que abordamos y 
comprendemos los datos. 

Uno de los pioneros en esta revolución fue John Tukey, un estadístico y matemático estadounidense. En la década de 
1960, Tukey introdujo el concepto de ”análisis exploratorio de datos”, destacando la importancia de visualizar y explorar los 
datos antes de aplicar métodos estadísticos formales. Sus ideas sentaron las bases para el desarrollo de herramientas gráficas 
y métodos visuales que hoy son fundamentales en la estadística moderna. 

En la misma época, el estadístico británico Sir David Cox hizo contribuciones significativas al desarrollo de los modelos 
de regresión, proporcionando métodos estadísticos más avanzados para comprender las relaciones entre variables. Su trabajo 
influyó en la formulación de modelos más complejos y en la mejora de la precisión de las predicciones. 

En el siglo XXI, la estadística se ha convertido en una disciplina omnipresente en la era de los datos masivos, liderando 
la revolución de la inteligencia artificial (IA) y el aprendizaje automático (AA). Pioneros como Jeff Wu, un destacado 
estadístico y profesor, han desempeñado un papel clave en la integración de la estadística con la IA y el AA. Wu abogó por 
la importancia de la estadística en la toma de decisiones basada en datos, destacando cómo las técnicas estadísticas pueden 
mejorar la confiabilidad y la interpretación de los resultados generados por algoritmos de aprendizaje automático. 

La figura de Trevor Hastie, otro influyente estadístico y científico de datos, se destaca en la convergencia de la estadística 
y la ciencia de datos. Su trabajo en métodos de regresión, clasificación y reducción de dimensionalidad ha sido fundamental 
en la aplicación práctica de la estadística en la resolución de problemas del mundo real, desde la medicina hasta la ciencia 
de materiales. 


3 Aplicaciones de la estadística y el cálculo de probabilidades al estudio y 
toma de decisiones en problemas de las ciencias sociales y de la naturaleza 


El método estadístico, aplicado en diversos campos de investigación, sigue un proceso que abarca varias etapas clave. En la 
etapa de recogida de datos, se destaca la importancia de la confianza en los datos, que pueden ser obtenidos por el investigador 
o de fuentes externas, como estadísticas oficiales. Esta fase incluye censos, estadísticas temporales y encuestas, donde surge 
el desafío de determinar la representatividad de la muestra. 

La elaboración de datos implica depurar, dar forma y presentar los datos de manera adecuada, considerando la escala 
y la agrupación. En la fase de reducción de datos, se sacrifica información para obtener claridad y flexibilidad, esencial 
para el tratamiento posterior. Se destaca la importancia de incluir gráficos y diagramas para una visualización clara de la 
distribución. 

En el análisis de datos, si bien algunos estudios interpretan la distribución, la mayoría busca modelos probabilísticos para 
describir adecuadamente los datos. Por tanto es necesario aplicar medidas para comprobar la concordancia o la bondad del 
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ajuste cuando se propone un modelo probabilístico. Además, en muchos casos se desea estimar parámetros desconocidos de 
la población a partir de la muestra elegida, siempre que esta sea aleatoria o representativa. 

Vemos por tanto que en cualquiera de estos casos se deben tomar decisiones estadísticas. Para que estas decisiones 
sean efectivas, es necesario formular suposiciones sobre las poblaciones estudiadas. Estas suposiciones, llamadas Hipótesis 
Estadísticas, pueden ser ciertas o formuladas con el propósito de ser rechazadas. 

Si, bajo una hipótesis supuesta cierta, los resultados observados difieren significativamente, se considera que las diferencias 
son significativas, permitiendo el rechazo de la hipótesis. Los Errores de Tipo 1 ocurren cuando se rechaza una hipótesis que 
debería aceptarse, mientras que los Errores de Tipo II suceden cuando se acepta una hipótesis que debería ser rechazada. 

En el diseño de ensayos de hipótesis, se busca minimizar los errores de decisión, aunque la reducción de un tipo de error 
suele aumentar el otro. Para mitigar ambos errores, se opta por aumentar la muestra, aunque esto no siempre es factible. 

Otro método para tomar decisiones en estadística son los árboles de decisión. Estos diagramas jerárquicos representan de 
manera visual las opciones disponibles y las posibles consecuencias de las decisiones. Cada nodo en el árbol representa una 
elección, y las ramas indican las distintas alternativas. Al aplicar la toma de decisiones mediante un árbol, se evalúan las 
hipótesis y se consideran los posibles resultados. Esto proporciona un marco claro para entender las implicaciones de cada 
decisión, ayudando a minimizar los errores de decisión y facilitando la selección de la opción más adecuada en función de los 
objetivos establecidos. Se entiende así que el esquema de un proceso de Bayes sea también un proceso de toma de decisiones, 
aunque el mayor problema es calcular las probabilidades condicionadas que nos encontramos. 

Al fin y al cabo lo que perseguimos es poder predecir cuál será una buena decisión. Y la palabra predicción debemos 
entenderla en un sentido muy amplio, el cual está relacionado con la posibilidad de responder a preguntas del tipo ¿qué va a 
ocurrir en determinadas condiciones? ¿qué medida debemos tomar para obtener un determinado resultado?. La predicción es, 
por tanto, el fin último de la ciencia. Así, una planificación racional de un sistema educativo, o de una central telefónica, o de 
la necesidad de un hipermercado, requiere de la predicción. La fiabilidad de la predicción que se efectúe vendrá determinada 
por la información, si tenemos o no, sobre las distribuciones de probabilidad ajustadas, lo que nos dice que la toma de 
decisiones es en sí una predicción. 

Veamos ahora en qué consiste esta toma de decisiones en distintas disciplinas: 


3.1 Estadística como ”Ciencia del estado” y ciencia social 


Hoy en día, observamos la relevancia de las "estadísticas oficiales” para el funcionamiento de un Estado y sus relaciones 
exteriores. Así, casi todos los países cuentan con Institutos Oficiales de Estadística (INE en España) que armonizan sus 
métodos estadísticos a través del Instituto Internacional de Estadística (ISI). En España, incluso algunas comunidades 
autónomas tienen sus propios institutos de estadística, que se preocupan de sus particulares temas de interés. También 
son fundamentales los estudios sociológicos sobre la evolución de los ciudadanos en los más diversos temas, de los que en 
nuestro país se ocupa el Centro de Investigaciones Sociológicas (CIS). Existen otras muchas estadísticas de interés en diversos 
campos y que se realizan a través de las empresas privadas de estadística, de la que hay un buen número en nuestro país. 
Destacaremos las "reglas estadísticas” (publicadas en BOE) que permiten la armonización de los controles de calidad en las 
empresas y la adjudicación de ”sellos” de calidad. 

Otro de los orígenes de la estadística son los primeros estudios sobre tablas de mortalidad, principalmente aplicadas por las 
compañías de seguros, hasta los complejos modelos econométricos, la estadística ha supuesto una herramienta fundamental 
en todas las ciencias centradas en el estudio de los seres humanos y sus relaciones. Así, habitualmente, podemos encontrar 
“estadísticas” en estudios económicos, demográficos, sociológicos, psicológicos, políticos, geográficos, educativos, etc. Como 
ejemplos podemos señalar desde las sencillas “pirámides de población”, las tasas de natalidad o los tests psicotécnicos, hasta 
los complejos modelos estadísticos usados para modelizar el funcionamiento de los mercados económicos. 

Vale la pena destacar la aportación de la estadística al trabajo por acabar con las desigualdades sociales ya que nos brinda 
una visión cuantitativa de las diferencias estructurales en nuestra sociedad (machismo, racismo, LGTBlfobia...), lo que nos 
permite identificar problemas, medir su alcance y desarrollar soluciones informadas. A través de un análisis riguroso de los 
datos, podemos trabajar hacia una sociedad más justa e inclusiva para todos. 

Por ejemplo, consideremos el análisis estadístico de la brecha salarial de género. Los datos muestran consistentemente 
que las mujeres ganan menos que los hombres en muchos campos laborales, incluso cuando tienen la misma educación y 
experiencia. Al desglosar estos datos por sector, ubicación geográfica y otros factores, los investigadores pueden identificar 
áreas específicas donde la brecha salarial es más pronunciada, lo que permite a los responsables de políticas y activistas dirigir 
sus esfuerzos hacia la igualdad de remuneración. 


3.2 Aplicaciones en las ciencias experimentales 


La estadística es una herramienta fundamental en casi todas las ciencias experimentales ya que permite medir las diferencias 
entre los valores experimentales obtenidos y los valores esperados según el modelo teórico supuesto ("método científico”). 
Así, en Física, los métodos estadísticos se pueden utilizar para controlar los errores de medida y, por ejemplo, estudiar si los 
modelos de la mecánica de Newton (también los postulados relativistas de Einstein) coinciden con los valores experimentales 
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observados. En otras ocasiones los modelos físicos incluyen modelos estadísticos y probabilísticos como las Leyes de la 
termodinámica (mecánica estadística) o los postulados cuánticos como el principio de incertidumbre. 

La Biología es, quizás, la ciencia donde más aplicaciones estadísticas se utilizan, desde las primeras aplicaciones para la 
constatación empírica de la teoría de la evolución de Darwin o la clasificación de especies, a las numerosísimas aplicaciones 
actuales, como lo prueba de hecho de que dos de las mejores revistas de estadística se llamen “Biometrika” y “Biometrics”. 
También en la Biología los modelos estadísticos se incorporan a los modelos biológicos, como ocurre, por ejemplo, en las Leyes 
de Mendel. Las aplicaciones en otras ciencias son numerosísimas y, por ello, la estadística es una asignatura fundamental en 
los grados de Químicas (velocidad de reacciones químicas, composiciones,...), Medicina, Veterinaria... Cabe destacar en las 
aplicaciones de la estadística en las Ciencias de la Salud el uso de la estadística inferencial y en concreto de los contrastes 
de hipótesis para la toma de decisiones en la eficacia de tratamientos y pruebas de detección de enfermedades, en donde 
juegan un papel decisivo los errores de tipo I y II asociados al test. Por ejemplo, probabilidad de estar sano habiendo dado 
positivo en un test (falsos positivos) o, el que se intenta minimizar, probabilidad de estar enfermo habiendo dado negativo 
(falsos negativos). Durante la pandemia del coronavirus del 2020 con las PCRs y test de autodiagnóstico estos conceptos 
estadísticos llegaron a la población general así como otros relacionados con la transmisión del virus, la mortalidad, etc; 


3.3 Aplicaciones en la industria y el comercio 


También la Estadística es una asignatura obligatoria en casi todas las ingenierías, donde son utilizadas desde para estudiar la 
resistencia de un determinado material, hasta para el estudio de plantaciones agrícolas en las que influyen diversos factores. 
En las empresas e incluso en algunos comercios, las estadísticas son fundamentales para medir su evolución, o realizar un 
control de calidad sobre los productos fabricados o recibidos. En este punto, la estadística ha supuesto un peldaño más en la 
competencia entre empresas, por lo que las empresas de mayor importancia disponen de un departamento propio de control 
de calidad donde se investigan nuevos y más eficaces métodos estadísticos. 

En este contexto resaltamos un razón más por las que es necesario el muestreo ya que algunas de las mediciones de 
atributos/variables pueden resultar en la destrucción de los objetos estudiados y por lo tanto solo puede aplicarse a una parte 
de la población. Por ejemplo, las horas de duración de una bombilla antes de fundirse o el peso que soporta una cuerda antes 
de romperse. 


3.4 Big Data 


Erik Larson utilizó este término por primera vez en 1989 y hace referencia al almacenamiento de grandes cantidades de 
datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. El fenómeno del big data 
también se denomina a veces datos a gran escala, aunque suele usarse su denominación en inglés. La disciplina dedicada a 
los datos masivos se enmarca en el sector de las tecnologías de la información y la comunicación. Esta disciplina se ocupa de 
todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos. Las dificultades más habituales 
vinculadas a la gestión de estas cantidades de datos se centran en la recolección y el almacenamiento, búsqueda, compartición, 
análisis, y visualización. La tendencia a manipular enormes cantidades de datos se debe a la necesidad en muchos casos de 
incluir dicha información para la creación de informes estadísticos y modelos predictivos utilizados en diversas materias, 
como los análisis de negocio, publicitarios, los datos de enfermedades infecciosas, el espionaje y seguimiento a la población 
o la lucha contra el crimen organizado. En lo que se refiere al análisis de datos masivos se han desarrollado nuevas técnicas 
de tratamiento. La rama de la estadística que trata estas técnicas de denomina “Minería de datos” y tiene como objetivo 
encontrar comportamientos predictivos. Engloba el conjunto de técnicas que combina métodos estadísticos y de machine 
learning con almacenamiento en bases de datos. Está estrechamente relacionada con los modelos utilizados para descubrir 
patrones en grandes cantidades de datos. 

Estas técnicas son fundamentales para descubrir patrones significativos en grandes volúmenes de información, lo que ha 
llevado a un aumento cualitativo en el análisis de datos masivos. 


3.5 En el deporte 


Las estadísticas son imprescindibles en el mundo del deporte, cualquier equipo/deportista que se precie debe estudiar sus 
propias estadísticas y las de sus competidores para poder planificar una estrategia ganadora. 

Los expertos deportivos también estudian las estadísticas para poder hacer sus previsiones y análisis. En el mundo 
del béisbol se creó hasta un término para hacer referencia al estudio de sus estadísticas ”sabermetrics”. Este término fue 
acuñado por Bill James, el autor de los best-seller ” The Bill James Historical Baseball Abstract” (70s), en las que recopilaba 
las estadísticas más relevantes de este deporte. Aparecían nuevas métricas que permitían detectar juegadores valiosos que 
pasaban desapercibidos con las métricas tradicionales. Durante dos décadas la utilidad de estas métricas fue cuestionada, 
incluso tomada a broma, hasta que un equipo las aplico de manera tajante en su estrategia deportiva. Oakland Athletics era 
el equipo con menos presupuesto de la liga de béisbol y gracias a las estrategias aplicadas basándose en la estadística ganaron 
el 77% de los partidos y quedaron segundos en la liga en 2001 y primeros en 2002. Este éxito fue recogido tiempo después en 
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un libro ”Moneyball”, en la actualidad también hay una película con este nombre. Este fue un punto de inflexión del estudio 
de la estadística deportiva, ya que no solo se extendió a otro equipos de béisbol si no al resto de categorías deportivas. 


4 Aspectos didácticos 


Es en la orden ECD/1172/2022 y ECD/1173/2022, del 2 y 3 de agosto de 2022, en la que se aprueba el currículo y las 
características de la evaluación de la ESO y Bachilller, respectivamente. Dentro de los saberes básicos es el sentido estocástico 
donde se da uso práctico a lo presentado en este tema y que se desarrolla a lo largo de todas las etapas con distintos niveles 
de profundidad. Es uno de los temas más interesantes para trabajar la CEM 6 ya que sus aplicaciones prácticas y cotidianas 
son muy directas y visibles a la hora de poder motivar al alumnado y trabajar obteniendo datos reales de su entorno. 
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